中医妇科自动组方相关 本项目为本人参与的中医妇科自动组方项目,这个仓库是整个项目的代码,但其中一部分模块本人并没有参与这些模块均已标注未参与,具体的项目解释在我的csdn帖子中,欢迎做相关工作的同学与我邮箱联系[email protected]
本项目结构为
- 数据处理
- 该文件夹为在本次项目中使用过的数据,具体详情见该文件夹内的readme
- 实体识别
在本次项目中实体识别模块,在本次项目中使用了两种模型,一种是直接调用CRF++模型,一种是BiLstm+CRF模型- CRF
直接调用CRF的模型,这部分不是本人参与的,具体内容见该文件夹内的CRF工程文档 - BiLSTM+CRF
该模块为通过BiLSTM编码器得到语义表示矩阵,将该矩阵通过CEF解码得最终的标注结果
- CRF
- 知识图谱
将数据通过结构化之后得到的知识图谱- 同义词集
一部分数据是从网上下载的同义词字典,一部分是我们根据字面相似度计算得到的同义词,具体解释见readme - 知识图谱本体
该本体结构是我们在医生的指导下人为定义的知识图谱本体
- 同义词集
- 自动组方
该文件夹实现了中医妇科自动组方功能,其中有两种思路,一种是基于分类的方法一种是基于统计学的聚类方法。其中分类方法分为自上而下与自下而上,本人未参与自上而下模块的开发,在此只是单纯的将其复制保存过来;在基于统计学聚类方法为本人和马泽瑞共同完成。- 分类模块
该模块的思路是通过病人的疾病归纳出病人的证型,在通过证型与疾病共同来得出所开方剂 - 基于互信息的聚类模块
该模块的思路是通过基于统计的互信息计算得到病症团,通过病人的病症团对应的数据中的方剂,最终该项目采用了聚类模块作为最终的方法,关于这个模块的具体信息请关注我的csdn,后续会补上该blog
- 分类模块