Research Paper Summarization System

A modern web application that automatically fetches, analyzes, and summarizes research papers from arXiv. The system uses GPT-4 to generate detailed summaries and insights from academic papers across multiple scientific domains.

Features

Automated Paper Processing:
- Daily fetching of new papers from arXiv
- Parallel processing of multiple categories
- Smart paper selection based on impact and novelty
- PDF text extraction and analysis
- Detailed summaries using GPT-4
Categories Covered:
- Machine Learning (cs.LG)
- Natural Language Processing (cs.CL)
- Computer Vision (cs.CV)
- Statistical ML (stat.ML)
- Quantum Physics (quant-ph)
- Nuclear Theory (nucl-th)
- Nuclear Experiment (nucl-ex)
- Materials Science (cond-mat.mtrl-sci)
- Galaxy Astrophysics (astro-ph.GA)
- Neurons & Cognition (q-bio.NC)
- Crypto & Security (cs.CR)
Modern Web Interface:
- Clean, responsive design
- Category-based browsing
- Paper details with comprehensive summaries
- Real-time generation status updates
- Pagination and sorting options

Tech Stack

Backend:
- FastAPI (Python web framework)
- MongoDB (document storage)
- arXiv API (paper fetching)
- OpenAI GPT-4 (paper analysis)
- PyPDF2 (PDF processing)
- Async processing with asyncio
Frontend:
- Next.js 13+ (React framework)
- Tailwind CSS (styling)
- TypeScript
- Axios (API client)

Setup

Prerequisites:

# Install Python 3.8+ and Node.js 16+
python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

Environment Variables: Create a .env file in the root directory:

OPENAI_API_KEY=your_openai_api_key
MONGODB_URI=your_mongodb_connection_string

Backend Setup:

cd backend
pip install -r requirements.txt
python main.py

Frontend Setup:
```
cd frontend
npm install
npm run dev
```

API Endpoints

GET /api/generate: Trigger paper fetching and summarization
GET /api/categories: List all available categories
GET /api/category/{slug}: Get papers for a specific category
GET /api/blog/{slug}: Get detailed paper information
GET /api/papers: Get papers with filtering and pagination
GET /api/generation-status: Check paper generation status

Query Parameters:

date: Filter by date (YYYY-MM-DD)
page: Page number for pagination
per_page: Items per page
sort_by: Sort field (published_date, title, generation_date)
sort_order: Sort direction (asc, desc)

Features in Detail

Paper Selection

Papers are scored based on:
- Innovation and novelty
- Potential impact
- Technical significance
- Clarity of contribution

Summary Generation

Each paper summary includes:

Main objective and motivation
Key methodology
Significant findings
Technical details
Potential impact and applications

Performance Optimizations

Parallel processing of categories
Concurrent PDF analysis
Async MongoDB operations
Efficient caching
No duplicate paper processing

Development

Running Tests

# Backend tests
cd backend
pytest

# Frontend tests
cd frontend
npm test

Code Style

# Backend
black .
flake8

# Frontend
npm run lint

Contributing

Fork the repository
Create a feature branch
Commit your changes
Push to the branch
Create a Pull Request

License

MIT License - see LICENSE file for details

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
backend		backend
frontend		frontend
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Research Paper Summarization System

Features

Tech Stack

Setup

API Endpoints

Features in Detail

Paper Selection

Summary Generation

Performance Optimizations

Development

Running Tests

Code Style

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Languages

yug-space/arxivdigest

Folders and files

Latest commit

History

Repository files navigation

Research Paper Summarization System

Features

Tech Stack

Setup

API Endpoints

Features in Detail

Paper Selection

Summary Generation

Performance Optimizations

Development

Running Tests

Code Style

Contributing

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages