DataMate是面向模型微调与RAG检索的企业级数据处理平台,支持数据归集、数据管理、算子市场、数据清洗、数据合成、数据标注、数据评估、知识生成等核心功能。
如果您喜欢这个项目,希望您能给我们一个Star⭐️!
- 核心模块:数据归集、数据管理、算子市场、数据清洗、数据合成、数据标注、数据评估、知识生成
- 可视化编排:拖拽式数据处理流程设计
- 算子生态:丰富的内置算子和自定义算子支持
- Git (用于拉取源码)
- Make (用于构建和安装)
- Docker (用于构建镜像和部署服务)
- Docker-Compose (用于部署服务-docker方式)
- kubernetes (用于部署服务-k8s方式)
- Helm (用于部署服务-k8s方式)
wget -qO docker-compose.yml https://raw.githubusercontent.com/ModelEngine-Group/DataMate/refs/heads/main/deployment/docker/datamate/docker-compose.yml \
&& REGISTRY=ghcr.io/modelengine-group/ docker compose up -dgit clone git@github.com:ModelEngine-Group/DataMate.git
cd DataMatemake install本项目支持docker-compose和helm两种方式部署,请在执行命令后输入部署方式的对应编号,命令回显如下所示:
Choose a deployment method:
1. Docker/Docker-Compose
2. Kubernetes/Helm
Enter choice:若您使用的机器没有make,您也可以执行如下命令部署:
REGISTRY=ghcr.io/modelengine-group/ docker compose -f deployment/docker/datamate/docker-compose.yml --profile milvus up -d当容器运行后,请在浏览器打开 http://localhost:30000 查看前端界面。
要查看所有可用的 Make 目标、选项和帮助信息,请运行:
make help如果您是离线环境,您可以执行如下命令下载所有依赖的镜像:
make downloadmake install-label-studiomake build-mineru
make install-minerumake install-deer-flow本地代码修改后,请执行以下命令构建镜像并使用本地镜像部署
make build
make install dev=truemake uninstall在运行 make uninstall 时,卸载流程会只询问一次是否删除卷(数据),该选择会应用到所有组件。卸载顺序为:milvus -> label-studio -> datamate,确保在移除 datamate 网络前,所有使用该网络的服务已先停止。
- DEVELOPMENT.md - 本地开发环境搭建和工作流程
- AGENTS.md - AI 助手指南和代码规范
- backend/README-zh.md - 后端架构、服务和技术栈
- backend/api-gateway/README-zh.md - API Gateway 配置和路由
- backend/services/main-application/README-zh.md - 主应用模块
- backend/shared/README-zh.md - 共享库(domain-common, security-common)
- runtime/README-zh.md - 运行时架构和组件
- runtime/datamate-python/README-zh.md - FastAPI 后端服务
- runtime/python-executor/README-zh.md - Ray 执行器框架
- runtime/ops/README.md - 算子生态
- runtime/datax/README-zh.md - DataX 数据框架
- runtime/deer-flow/README-zh.md - DeerFlow LLM 服务
- frontend/README-zh.md - React 前端应用
感谢您对本项目的关注!我们非常欢迎社区的贡献,无论是提交 Bug 报告、提出功能建议,还是直接参与代码开发,都能帮助项目变得更好。
• 📮 GitHub Issues:提交 Bug 或功能建议。
• 🔧 GitHub Pull Requests:贡献代码改进。
DataMate 基于 MIT 开源,您可以在遵守许可证条款的前提下自由使用、修改和分发本项目的代码。