用户需求
核心算法:
· textcnn申请网络 病例诊断
· 病例核心语句挑选(f(x1,x2,x3) ,x1,x2,x3依次置空的方式获得贡献度)
· ngram +fp_growth 从病例依据 生成病的常见模式(可存储为图谱)
本体+关系:病名、症状、药物
过程:NER,核心语句提取,
· 备选药品图谱回扫病例,推荐出病例症状不冲突的药品最终给出一个病历得出三个产出结果:
- 病例诊断结果,
- 诊断依据 or 提纯后的病例模式,
- 指导用药。
同时存在一个肾结石医疗指南,记录了肾结石的症状,存为一个知识图谱,
病名、症状
需要把病历的诊断模式,在指南中找到依据,
将指南的依据,作为诊断结果的双重验证。
最终给出一个病历得出三个产出结果:
- 病例诊断结果,
- 诊断依据 or 提纯后的病例模式,
- 指导用药。
目前做针对单个肾结石疾病对于漏诊(原本有病,分类为没病),
给出疑似患有肾结石的诊断结果对于误诊,(没病,分类为有病),误诊:
1.模式生成的时候会卡支持度,出现频率低的模式我们会直接拿掉,出现高频的模式误诊的概率应该会很小。
2.对高频的模式根据权威书籍做双重验证,不满足的,也直接拿掉
病历模式是什么
病历模式指的就是按上个方案,原来的思路的话,就是从病历里面抽取的决定性的分类因素,比如之前按照神经网络分类去诊断病例,有什么病,然后是通过对每个语句的痣空去得出每个语句的一个贡献程度,然后再拿这些提取出来的关键语句去回扫病历,相当于是得出的是病历里面对诊断出这个病的关键性描述的一个总结。</

本文介绍了一个医疗知识图谱项目,通过提取命名实体和构建知识图谱,提高诊断依据的准确性和可解释性。项目涉及数据清洗、命名体提取、知识图谱建立,并探讨了技术难点和创新点,包括命名实体识别的准确性、知识存储以及非结构化文本的结构化处理。项目资料和相关参考资料可供下载。

1922

被折叠的 条评论
为什么被折叠?



