Skip to content

Conversation

@ericshao
Copy link
Owner

@ericshao ericshao commented Apr 1, 2025

Description

[Briefly describe the changes made in this pull request.]

Related Issues

[Reference any related issues or tasks addressed by this pull request.]

Changes Made

[List the specific changes made in this pull request.]

Checklist

  • Changes tested locally
  • Code reviewed
  • Documentation updated (if necessary)
  • Unit tests added (if applicable)

Additional Notes

[Add any additional notes or context for the reviewer(s).]

ericshao and others added 30 commits March 10, 2025 14:25
- 实现了 Dify External Knowledge API 路由和相关功能
- 添加了知识图谱数据处理和查询相关路由
- 更新了文档访问和查询结果格式
- 优化了 CSV 文件处理逻辑
- 调整了异步操作的最大数量,默认值改为 24
- 更新实体提取最大尝试次数为环境变量配置,默认值为 2
- 优化实体提取日志输出,增加详细信息
- 调整 OpenAI 完成请求的温度参数为 0.7
- 修改实体类型列表,增加 "OtherProducts" 类型
- 更新元组分隔符为 "!!"
- 修改了 kg_routes.py 中的 HTTP 异常状态码
- 移除了 Neo4JStorage 类中的标签缓存相关代码
- 更新了 Postgres 实现中的 chunk_id 字段类型
- 优化了 kg_manage.py 中的实体更新逻辑
- 修复了 lightrag.py 中的文本清理函数调用
- 在 Neo4JStorage 类中添加节点和边存在性检查的缓存
- 实现缓存 TTL 和最大缓存大小的控制
- 在节点和边的增删操作后清除相关缓存
- 优化了节点和边存在性检查的性能
feat(kg): 为 Neo4j 存储实现添加缓存功能
- 调整了 DEFAULT_ENTITY_TYPES 列表,增加了新的实体类型
- 优化了实体类型的分类和命名,提高了数据的准确性和可读性
- 引入 LightRAG 类型注解以提高代码可读性和安全性
- 优化 update_entity 函数,移除了不必要的注释和代码
- 在更新实体时,现在也更新向量数据库中的实体信息
- 为 _insert_done 函数添加 LightRAG 类型注解
- 使用阿里云的 Python 3.11-slim 镜像作为基础镜像
- 添加阿里云 Debian 镜像源到 /etc/apt/sources.list
- 设置清华大学 PyPI 镜像源作为全局代理
…dates to prevent connection exhaustion

- Add retry logic to the `has_node` and `has_edge` methods to improve fault tolerance.
- Implement a batch processing function `batch_process` to limit the number of concurrent updates.
- Convert node and edge merge/insert operations to batch processing to enhance performance.
- Optimize logging and pipeline status updates to improve transparency.
- 将基础镜像从阿里云更新为 func.ink 的 Python 3.11.7-slim-bookworm 版本
- 配置 Debian APT 源,包括主源、安全更新源和常规更新源
- 添加 Rustup 镜像源以支持 Rust 工具链的安装
- 移除知识图谱 JSON 格式中未使用的来源解析代码
- 更新 PostgreSQL 数据库表结构,将 chunk_id 字段改为 chunk_ids 数组类型
- 调整 OpenAI LLM 调用的温度参数,从 0.7 降低到 0.6
- 优化实体提取流程,保留初始提取结果供调试使用
- 修改 postgres_impl.py 中的 SQL 查询,提高查询效率
- 重构 lightrag.py 中的文本处理逻辑,简化代码结构
- 优化 operate.py 中的节点和边数据处理,增强数据安全性和可读性
- 在 _process_extraction_result 函数中添加 file_path 参数
- 在 _get_node_data 和 _get_edge_data 函数中,使用 get 方法获取 text_units 中的 file_path,若不存在则默认为 "unknown_source"
- 在 kg_routes.py 中为所有知识图谱相关路由添加了认证依赖
- 使用 get_combined_auth_dependency 函数创建认证依赖对象
@ericshao ericshao changed the title Merge main Compare against main brunch Apr 1, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant