RAG Query API

This is a FastAPI-based backend service that powers a Retrieval-Augmented Generation (RAG) pipeline using a local SQLite knowledge base and Pinecone vector search.

Features

Query a multimodal (text + image) knowledge base via /query endpoint
Uses Pinecone for vector similarity search
GPT-4o-mini model via AIProxy (supports vision for image analysis)
Auto-generated embeddings using OpenAI-compatible embedding model
Returns contextual answers along with source links
Handles rate-limiting and retries on failures
Health-check endpoint at /health

Requirements

Python 3.8+
Environment Variables:
- API_KEY (for AIProxy OpenAI-compatible API)
- PINECONE_API_KEY (your Pinecone API key)
- PINECONE_ENV (Pinecone environment, e.g., us-east-1-aws)

Setup

Clone the repository
Create and activate a virtual environment
Install dependencies:
```
pip install -r requirements.txt
```

Create a .env file with the required keys:

API_KEY=your_aipipe_api_key
PINECONE_API_KEY=your_pinecone_key
PINECONE_ENV=us-east-1-aws

Running the API

uvicorn app:app --reload --port 8000

Endpoints

POST `/query`

Query the knowledge base with text and optionally an image (base64).

Request:

{
  "question": "Explain cosine similarity",
  "image": "base64_string_if_any"
}

Response:

{
  "data": {
    "answer": "Cosine similarity measures ...",
    "links": [
      {"url": "https://example.com", "text": "Relevant source"}
    ]
  }
}

GET `/health`

Checks DB connectivity and whether embeddings exist.

Database Schema

discourse_chunks: stores forum chunks with embeddings
markdown_chunks: stores markdown doc chunks with embeddings

Notes

Handles rate limits and retries gracefully
Image support via GPT-4o multimodal model
Logs important events and errors with full tracebacks

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
app.py		app.py
db.py		db.py
knowledge_base.db		knowledge_base.db
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

RAG Query API

Features

Requirements

Setup

Running the API

Endpoints

POST `/query`

GET `/health`

Database Schema

Notes

License

About

Uh oh!

Releases

Packages

Languages

sandeepstele/tds2-p1

Folders and files

Latest commit

History

Repository files navigation

RAG Query API

Features

Requirements

Setup

Running the API

Endpoints

POST /query

GET /health

Database Schema

Notes

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

POST `/query`

GET `/health`

Packages