EasyVectorDB 是一个面向开发者与研究者的 向量数据库系统性学习项目。
项目内容覆盖从基础概念、算法原理到生产级应用部署的全流程,聚焦以下三个方向:
- 🧩 理论入门:理解向量数据库的原理、架构与索引机制
- ⚙️ 实战教程:掌握 Milvus / Faiss / Annoy 的使用与优化技巧
- 💡 项目案例:从零构建 RAG、嵌入检索、聚类可视化等完整项目
项目共分为 基础学习篇 与 实践篇 两个部分,对应导航栏配置如下:
| 章节 | 关键内容 | 状态 |
|---|---|---|
| 第一部分:基础学习篇(Base) | 向量数据库原理、嵌入与搜索基础 | |
| Chapter 1 项目介绍 | 项目目标、整体学习路径 | ✅ |
| Chapter 2 为什么需要向量数据库 | 检索瓶颈、相似度搜索原理 | ✅ |
| Chapter 3 向量嵌入算法基础 | Word2Vec、Transformer Embedding | ✅ |
| Chapter 4 向量搜索算法基础 | 暴力检索、向量相似度 | ✅ |
| Chapter 5 ANN 搜索算法 | IVF、PQ、HNSW、LSH、Annoy算法原理与代码实战 | ✅ |
| Chapter 6 实现你自己的向量数据库 | 向量数据库最小实现 | ✅ |
| 第二部分:Faiss 教程(Faiss) | 高性能向量检索引擎实战 | |
| Chapter 1 FAISS 入门与环境搭建 | 安装配置、基础概念 | ✅ |
| Chapter 2 FAISS 核心索引实战 | Flat、IVF、PQ、HNSW 等索引 | ✅ |
| Chapter 3 FAISS 核心功能进阶 | 复合索引、GPU、批量检索 | ✅ |
| Chapter 4 FAISS 性能调优与评估 | Recall、延迟、内存调优 | ✅ |
| Chapter 5 FAISS 工程化落地实战 | 工程结构、服务化、实战案例 | ✅ |
| 第三部分:Milvus 教程(Milvus) | 分布式向量数据库与工程实践 | |
| Chapter 1 Milvus 向量数据库入门:认知与架构 | 架构设计、核心组件 | ✅ |
| Chapter 2 Milvus 核心概念:数据模型与索引体系 | Collection、Partition、Index | ✅ |
| Chapter 3 Milvus 基础操作:PyMilvus核心API实战 | Milvus数据写入、查询、索引管理 | ✅ |
| Chapter 4 Milvus的AI应用开发:基于BM25的混合搜索向量数据库开发实战 | RAG、混合向量检索应用 | ✅ |
| Chapter 5 Milvus的AI应用开发:图像检索应用实战 | 图像检索应用 | ✅ |
| Chapter 6 Milvus 选学部分 | Milvus底层架构详解、Milvus Lite部署与应用、MinerU部署教程 | ✅ |
| 第四部分:基于向量数据库的AI应用开发 | ||
| project 1 基于FAISS框架RAG实战项目 | RAG with FAISS | ✅ |
| project 2 基于Milvus框架的Agent项目 | Agent with Milvus | ✅ |
| project 3 XXXXXXXXX | 别急还没想好项目3做啥,正在筹备中... | 🚧 |
| 第五部分:补充内容 | 与向量数据库有关的内容 | |
| 向量基础知识 | 向量基础概念与数学原理 | ✅ |
| FusionANNS架构设计 | GPU加速检索系统架构 | ✅ |
| Meta-Chunking策略 | 智能文本切分算法 | ✅ |
| 检索理论极限 | 向量检索性能边界分析 | ✅ |
| RabitQ索引技术 | 高维向量量化方法 | ✅ |
| 聚类算法 | 聚类算法介绍 | ✅ |
| 或者你想要添加更多具体的文档项?可以告诉我具体要补充哪些内容。 |
如果你是想在原来的JSON导航结构中添加,也可以告诉我具体要加在哪个位置。 ⏳ 持续更新中...
📘 本项目旨在让你从 原理 → 实践 → 部署 全流程掌握向量数据库核心知识与实战能力。
.
├── docs 向量数据库学习指南与项目文档
├── data 通用示例数据目录
├── src 项目相关代码
└── tmp 临时文件目录
- 📚 Datawhale社区介绍
- 🌐 在线文档站点
- 💻 项目源码
【相关竞赛】
- 如果你发现了一些问题,可以提Issue进行反馈,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
- 如果你想参与贡献本项目,可以提Pull request,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
- 如果你对 Datawhale 很感兴趣并想要发起一个新的项目,请按照Datawhale开源项目指南进行操作即可~
- 牧小熊-项目负责人(Datawhale成员)
- 刘晓-项目贡献者(Datawhale鲸英助教)
- 柯慕灵-项目贡献者(Datawhale成员)
- 赵鑫龙-项目贡献者(Datawhale精英助教)
- 陈辅元-项目贡献者(Datawhale成员)
- 感谢 @Sm1les 对本项目的帮助与支持
- 感谢所有为本项目做出贡献的开发者们 ❤️

