Albert API est une initiative d'Etalab. Il s'agit d'une API open source d'IA générative développée par Etalab. Elle permet d'être un proxy entre des modèles de langage et vos données. Elle agrège les services suivants :
- servir des modèles de langage avec vLLM
- servir des modèles d'embeddings avec HuggingFace Text Embeddings Inference
- servir des modèles de reconnaissance vocale avec Whisper OpenAI API
- accès un vector store avec Qdrant pour la recherche de similarité
En se basant sur les conventions définies par OpenAI, l'API Albert expose des endpoints qui peuvent être appelés avec le client officiel python d'OpenAI. Ce formalisme permet d'intégrer facilement l'API Albert avec des bibliothèques tierces comme Langchain ou LlamaIndex.
L'API Albert expose une interface utilisateur permettant de tester les différentes fonctionnalités, consultable ici ici.
L'API Albert permet de converser avec différents modèles de langage.
L'API Albert permet d'accéder à un ensemble de modèles de langage et d'embeddings grâce à une API unique.
L'API Albert permet d'interroger des documents dans une base vectorielle. Ces documents sont classés dans des collections. Vous pouvez créer vos collections privées et utiliser les collections publiques déjà existantes. Enfin, une collection "internet" permet d'effectuer une recherche sur internet pour compléter la réponse du modèle.
L'API Albert permet d'importer sa base de connaissances dans une base vectorielle. Cette base vectorielle peut ensuite être utilisée pour faire de la RAG (Retrieval Augmented Generation).
L'API Albert permet de transcrire un fichier audio à l'aide d'un modèle Whisper.
Albert API est un projet open source, vous pouvez contribuer au projet en lisant notre guide de contribution.
Pour déployer l'API Albert sur votre propre infrastructure, suivez la documentation.