multi2vec-colpali-inference

The inference container for ColPali document retrieval models

Overview

This service provides document retrieval capabilities using ColPali models. ColPali is a vision-language model optimized for document understanding, supporting complex layouts, tables, charts, and multimodal content without requiring OCR preprocessing.

Supported Models

The service automatically supports all ColPali-compatible models:

ColQwen2 (recommended): vidore/colqwen2-v1.0
ColPali: vidore/colpali-v1.0, vidore/colpali-v1.1
ColSmol (smaller): vidore/colsmol-v1.0
Custom models following ColPali architecture

Environment Variables

Model Configuration

COLPALI_MODEL_NAME: ColPali model to download (default: vidore/colqwen2-v1.0)
TRUST_REMOTE_CODE: Enable trust remote code for custom models (default: false)

Hardware Configuration

ENABLE_CUDA: Enable CUDA GPU support (true or 1)
CUDA_CORE: Specific CUDA device (default: cuda:0)

Build Docker Container

LOCAL_REPO="multi2vec-colpali" \
  COLPALI_MODEL_NAME="vidore/colqwen2-v1.0" \
  ./cicd/build.sh

Model Examples

# ColQwen2 (recommended)
COLPALI_MODEL_NAME="vidore/colqwen2-v1.0" ./cicd/build.sh

# ColPali v1.1
COLPALI_MODEL_NAME="vidore/colpali-v1.1" ./cicd/build.sh

# ColSmol (smaller model)
COLPALI_MODEL_NAME="vidore/colsmol-v1.0" ./cicd/build.sh

API Endpoints

`/vectorize` - Document Retrieval (Primary)

Returns multi-vector embeddings optimized for document retrieval:

curl -X POST "http://localhost:8000/vectorize" \
  -H "Content-Type: application/json" \
  -d '{
    "texts": ["What is shown in this document?"],
    "images": ["<base64_encoded_image>"]
  }'

Response includes:

textVectors: Multi-vector query embeddings
imageVectors: Multi-vector document embeddings
similarityScores: MaxSim similarity scores (when both texts and images provided)

`/vectorize-clip` - Legacy Compatibility

Returns single vectors (mean pooled) for backward compatibility with CLIP-based systems.

`/meta` - Model Information

Returns model configuration and capabilities.

Key Features

Multi-vector embeddings: More precise document representation than single vectors
Layout awareness: Understands tables, charts, and spatial relationships
No OCR required: End-to-end visual document processing
MaxSim scoring: Advanced similarity computation for document retrieval
GPU acceleration: CUDA support for faster inference
Multiple model variants: Automatic support for all ColPali models

Run Tests

LOCAL_REPO="multi2vec-colpali" ./cicd/test.sh

Documentation

For more information about ColPali models and document retrieval:

Name		Name	Last commit message	Last commit date
Latest commit History 85 Commits
.github		.github
cicd		cicd
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
app.py		app.py
colqwen2.py		colqwen2.py
custom.Dockerfile		custom.Dockerfile
custom_prerequisites.py		custom_prerequisites.py
download.py		download.py
ingest-pdf-pages.py		ingest-pdf-pages.py
meta.py		meta.py
request.json		request.json
requirements-jp6.txt		requirements-jp6.txt
requirements-test.txt		requirements-test.txt
requirements.txt		requirements.txt
smoke_test.py		smoke_test.py
test-colpali-hybrid.py		test-colpali-hybrid.py
test1_b64.txt		test1_b64.txt
test1_small_b64.txt		test1_small_b64.txt
test1_small_b64_fixed.txt		test1_small_b64_fixed.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

multi2vec-colpali-inference

Overview

Supported Models

Environment Variables

Model Configuration

Hardware Configuration

Build Docker Container

Model Examples

API Endpoints

`/vectorize` - Document Retrieval (Primary)

`/vectorize-clip` - Legacy Compatibility

`/meta` - Model Information

Key Features

Run Tests

Documentation

About

Uh oh!

Releases

Packages

Contributors 6

Uh oh!

Languages

License

joshsgoldstein/multi2vec-transformers-colpali

Folders and files

Latest commit

History

Repository files navigation

multi2vec-colpali-inference

Overview

Supported Models

Environment Variables

Model Configuration

Hardware Configuration

Build Docker Container

Model Examples

API Endpoints

/vectorize - Document Retrieval (Primary)

/vectorize-clip - Legacy Compatibility

/meta - Model Information

Key Features

Run Tests

Documentation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 6

Uh oh!

Languages

`/vectorize` - Document Retrieval (Primary)

`/vectorize-clip` - Legacy Compatibility

`/meta` - Model Information

Packages