Abstract
随着医学信息技术与计算机科学的蓬勃发展,医疗服务行业逐渐从信息化向智慧化过渡。医学知识图谱在知识问答和智能诊断等智能医疗应用中发挥了重要作用,是推进智慧医疗的关键技术,也是医疗信息智能化管理的基础。为了充分发掘知识图谱在医学领域中的巨大潜力,本文从药物间关系发现、辅助诊断、个性化推荐、决策支持和智能预测这五个方面展开,介绍了医学知识图谱的最新研究进展,并结合当前医学知识图谱面临的挑战与问题提出相关建议,为推进医学知识图谱广泛应用提供参考。
Keywords: 辅助诊断, 智能预测, 医学知识图谱, 智慧医疗
Abstract
With the booming development of medical information technology and computer science, the medical services industry is gradually transiting from information technology to intelligence. The medical knowledge graph plays an important role in intelligent medical applications such as knowledge questions and answers and intelligent diagnosis, and is a key technology for promoting wise medical care and the basis for intelligent management of medical information. In order to fully exploit the great potential of knowledge graphs in the medical field, this paper focuses on five aspects: inter-drug relationship discovery, assisted diagnosis, personalized recommendation, decision support and intelligent prediction. The latest research progress on medical knowledge graphs is introduced, and relevant suggestions are made in light of the current challenges and problems faced by medical knowledge graphs to provide reference for promoting the wide application of medical knowledge graphs.
Keywords: Assistant diagnosis, Intelligent prediction, Medical knowledge graph, Wise medical
0. 引言
知识图谱是完善知识管理和智能服务的新兴技术,以更接近人类认知世界的形式进行信息表示,为组织、管理和理解海量信息提供了更好的方法。知识图谱于2012年由谷歌(Google)正式提出,其初衷是为了提高搜索引擎的能力,增强用户的搜索质量及搜索体验,主要包括通用知识图谱和领域知识图谱[1]。通用知识图谱更注重广度,强调融合更多的实体,包含大量的常识性内容。领域知识图谱所包含的知识具有很强的专业性,依靠特定领域的数据来进行构建。较通用知识图谱而言,领域知识图谱的准确度较高,具有特定的领域意义,目前主要的应用领域包括地理学领域、医学领域、电子商务领域等[2-3]。
医学知识图谱以结构化的形式描述医学实体和关系,是整合海量医学资源的重要表示之一[4]。将医学知识图谱与人工智能技术相结合,可以提高医生的诊断效率,在智慧医疗建设中具有关键性作用。为了探究知识图谱在医学领域中的应用现状与发展前景,本文从药物间关系发现、辅助诊断、个性化推荐、决策支持和智能预测这五个方面讨论了知识图谱在医学领域的具体应用。
1. 药物间关系发现
药物的研究历史悠久,但许多药理作用的发现确是偶然的[5]。仅仅依靠传统的方法去探究药理已经不能满足药物研究的需求,知识图谱作为一种新的方法应用到药物研究中,有望弥补传统方法在药物研究方面的不足。目前基于知识图谱的药物研究主要集中在药物再利用、药物间不良反应、联合药物治疗等方面。
新药研发具有周期长、成本高的特点,这使得研发新药成为一项艰巨的任务,而药物再利用作为新药研发的重要补充,有效缓解了新药研发面临的难题。目前基于知识图谱的药物再利用已在识别传统疑难疾病和突发性传染病有效药物的任务中取得一定的成果。在识别传统疑难疾病的有效药物研究中,桑盛田等[6]提出融合知识图谱与深度学习的药物发现方法,从已发表的文献中挖掘疾病的潜在治疗药物。在识别突发急性传染病有效药物的研究中,Korn等[7]将现有的生物医学知识图谱与新型冠状病毒感染 (corona virus disease 2019, COVID-19)最新生物医学文献信息相结合,建立了一个基于COVID-19的知识库,通过对知识图节点之间的关系进行推断来确定潜在的候选药物,实现已知药物和临床候选药物的再利用。除此以外,还有更多药物发现相关的工作也在陆续展开[8-12]。
现有药物的未知不良反应会给患者带来巨大的安全隐患,也限制了研究人员对药物成本的准确判断,提前预知药物可能带来的不良反应是有效解决上述问题的突破点,而机器学习与知识图谱相结合具有从现有知识中预测未知不良反应的潜力。Bean等[13]以药物不良反应(adverse drug reactions,ADR)的知识图谱为基础,开发了一种基于简单富集测试的机器学习算法,用于预测和了解临床试验中未观察到的ADR,该算法可自动检测到ADR并报告给相关监管机构,缓解了目前药物上市后监测报告不足的问题,同时减少了药物给患者带来的安全隐患。
联合药物治疗是治疗复杂疾病的一种很有前景的策略,在缺乏有效的单一疗法的情况下,联合用药发挥了重要作用[14]。Du等[15]提出一种自动化算法,根据从生物医学文献的结论性声明中提取的语义预测,发现有关联合药物治疗的知识,构建联合药物治疗知识图谱并应用到精准医疗中,根据患者基因谱的个体差异进行最佳的疾病管理,可帮助专家高效识别有效的联合疗法。
2. 辅助诊断
在临床诊断和治疗的基本过程中,医生收集患者信息,结合自己已有的经验和知识来决定下一个临床阶段的具体诊疗措施。而医生对患者信息的判断可能会受到特定情况、感觉能力和实践经验的影响,其判断具有主观性,难以统一标准[16]。因此,需要将医生诊断过程的经验转化为知识,使得诊断结果客观可追溯,是目前诊断方式的转变方向。要想完成这一转变,构建可靠的医学知识图谱来辅助诊断是未来的研究重点。
基于知识图谱的辅助诊断,主要采用知识嵌入、深度学习和知识推理等方法,根据医学实体间的关系获得对应的推理路径,最后结合症状和疾病间的关系,明确疾病诊断。Chai[17]以甲状腺疾病为例,构建医学知识图谱提取生物医学实体之间的关系,然后通过知识嵌入的方法将知识图谱中的实体和关系转化为低维的连续向量,利用已知的病理疾病关系数据,训练双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)的疾病诊断模型,结果表明基于深度学习和知识图谱融合的甲状腺疾病诊断比手工诊断更有效,比基于机器学习方法的诊断更准确。在中医诊断领域,Xie等[18]在中医症状知识图谱中引入了强化学习算法来挖掘实体间的隐性关系并获得推理路径,根据这个推理路径,可以推断出从症状到综合征的路径。Zhang等[19]提出了一种通过知识图谱上的演绎推理来模拟辨证论治的方法,该方法根据知识图谱中路径的加权得分计算可能性,从而对结果进行推理,以期实现中医的自动化诊断。而针对传统的知识图谱诊断方法多针对静态数据,不适用于具有动态变化特征医学数据的缺点,Song等[20]提出了一种基于嵌入式表示的深度学习方法,通过使用门控循环单元将时间信息引入知识图谱,并使用知识嵌入的方法保证知识图谱的结构属性,通过医学知识与时间数据的融合,提高了算法的准确性和算术性能,有效提升了诊断方案的可靠性。
3. 个性化推荐
随着精准医学的普及和发展,越来越多的患者开始寻求个性化医疗服务,但是患者在疾病和行为方面具有异质性的特点,提供个性化建议是一个巨大的挑战[21]。为了满足患者的需求,医生需要不断关注快速发展的医学研究报告,并在大量领域知识的基础上积累有效的临床治疗案例,因而加重了医生学习领域知识的负担。另一方面,随着人工智能技术的兴起,机器学习和深度学习为基于医学知识图谱的智能推荐提供了核心技术,在个性化推荐中充分应用人工智能技术,可以有效减轻医生的负担。目前,基于知识图谱的智能推荐已应用在科室推荐、药物推荐、处方推荐以及个性化饮食推荐等方面。例如,Liu等[22]基于区域卫生平台和医疗网站的电子健康档案数据,建立了一个疾病知识图谱,在此基础上开发了一个智能医院指导系统,根据患者和系统的对话来为患者推荐合适的科室。Yang等[23]使用当前主流的草药数据库来构建草药知识图谱,其中包含草药的名称、功能、禁忌证、疾病、化学成分、靶基因和蛋白质等实体信息,使用知识图中草药的一些属性作为附加的辅助信息,并提出了一种多层信息融合的图卷积(graph convolutional networks,GCN)模型,利用草药特性和融合不同层次的特征表示来增强草药推荐效果,并在中药处方数据集上的进行实验,从而证实了该方法的有效性。Wang等[24]利用中医知识图谱实现了中医病历推荐系统,根据患者的症状推荐相关处方,并以真实的中医临床数据验证了该方法的可行性,推荐的准确率在85%以上。
由于传统的系统通常是根据历史记录来推荐药物,推荐的变化速度无法跟上医疗实践中新疗法和治疗方法的快速更新,在历史电子病历中,甚至在完善的知识图谱中,几乎没有关于新的ADR信息,这使得基于历史记录的推荐模型很难支持新药物的更新推荐。考虑到上述挑战,Gong等[25]提出了一个框架,称为安全医学推荐(safe medical recommendations,SMR)。SMR通过桥接电子病历和医学知识图谱构建了一个高质量的异质图,且SMR将疾病、药品、患者及其相应的关系共同嵌入到一个共享的低维空间,最后SMR使用嵌入将药品推荐分解为一个链接预测过程,同时考虑患者的诊断方案和ADR,为患者推荐新出现的药品。此外,还有研究者们基于构建的健康饮食知识图谱,根据用户的舌相分类,自动对用户的体质类型进行分类,并提供个性化的食物建议[26]。
4. 决策支持
决策支持系统是实现精准医疗的关键,高效的决策支持系统可以减轻医生的压力,尽可能减少误诊情况的发生[27]。为了实现精准医疗的决策支持,当前主要采用的方法是基于知识图谱来构建监测和分析系统,从而实时监测和分析患者的状态,并在系统中引入风险预测模型,根据患者状态信息,自动生成诊断方案、评估潜在风险。Shang等[28]利用面向电子病历的知识图谱,创建了一个电子病历数据轨迹,并通过语义规则进行推理,通过推理的足迹,识别其他科室被忽视的慢性肾脏病患者,帮助临床医生做出综合决策。Wang等[29]将风险预测模型纳入知识图谱,可以为预防和控制糖尿病及其并发症提供决策支持。Xiong等[30]从电子病历中提取中成药(Chinese patent medicine,CPM)、疾病、症状等信息,构建知识图谱,基于该图谱生成CPM监测的规则库,对CPM的综合使用、重复用药、药与病、药量、循证治疗等情况进行监测,提供决策支持,同时对医生的处方进行多项基本审查,实现处方监控,确保用药安全。
5. 智能预测
智能预测是医学知识图谱研究的热点也是难点,精准的预测是实现智慧医疗的最终目标。当前智能预测的方法主要包括基于GCN的方法、基于神经网络的方法、基于知识图谱和注意力机制结合的方法等。这些方法已经在临床结果预测、疾病预测、癌症致死率预测、医学编码预测等方面取得一定的成果。
临床结果预测对患者和医疗服务提供者均具有重要影响,现有方法难以捕捉不同数据集特征和临床结果之间的变化关系,因此会导致多中心临床试验的数据未能充分发挥其作用。为了缓解以上问题,Chu等[31]提出了一个对抗性学习模型来捕捉来自多中心异质临床数据集的患者特征表示,这些特征用GCN自动编码器来训练,以预测心衰患者的急性肾脏损伤。
疾病间存在着错综复杂的关系,发现疾病之间的联系,可以提前预知患者的潜在疾病,帮助医生及时优化诊断方案,从而提高疾病的治愈率。Sun等[32]提出一种基于神经网络的疾病预测模型,通过捕捉电子病历和医学数据库的知识,结合患者的症状来归纳推断其嵌入,实现对一般疾病和罕见疾病的准确预测。Pham等[33]从健康相关数据集和医学领域知识的语料库中学习,构建医学领域知识图谱,基于该图谱开发出一个多疾病预测模型,以预测患者的潜在疾病。
在癌症致死率和医学编码预测研究中,Wang等[34]提出了一种基于图神经网络的新模型,通过该模型将知识图谱信息纳入合成致死性预测任务中,用于人类癌症综合致死率预测。Teng等[35]将知识图谱和注意力机制扩展到医学编码预测中,根据医疗记录的内容预测最终的国际疾病分类编码,将数据驱动的方法与医学知识相结合,极大地提高了编码预测的精度,减少了编码人员的工作压力。
6. 结论和展望
本文总结了知识图谱在医学领域的研究进展,目前医学知识图谱的主要应用方向可归纳为五个方面:①基于药物知识图谱,结合机器学习和深度学习的方法,实现ADR预测、识别有效的联合药物疗法、挖掘疾病的潜在治疗药物和快速确定流行病的候选药物;②根据患者信息,采用知识嵌入、深度学习和知识推理等方法,结合症状间的关系确认疾病,辅助医生进行疾病诊断;③根据不同类型的患者推荐不同的诊断方式方法,实现个性化的医疗服务,具体包括科室推荐、药物推荐、处方推荐以及个性化饮食推荐等方面;④构建细粒度的垂直领域知识图谱,基于该图谱建立决策评估模型,实时检测和分析患者状态,自动生成诊断参考方案、评估潜在风险,帮助临床医生做出综合决策;⑤知识图谱结合GCN、神经网络、注意力机制等方法实现智能预测,包括临床结果预测、疾病预测、癌症致死率预测、医学编码预测等。
综上所述,知识图谱作为聚合领域知识的一种有效手段,可以将医生的临床经验转换为医学知识,使得临床诊断的结果更加客观可追溯。随着医学知识图谱与图推理、机器学习、深度学习等人工技术的结合,在药物间关系发现、辅助诊断、个性化推荐、决策支持和智能预测方面取得优异的成果,大大减轻了医生的负担。但是在实际应用中,主要还存在以下两个问题:全科医学知识图谱完整性不足和知识推理结果的可靠性难以保证。对于前者,仍需计算机科学家与医学领域专家的共同努力,继续完善规范医学知识图谱;对于后者,基于知识图谱的推理系统主要是根据特定疾病的特点进行推理和预测,推理的方法还无法推广普及,基于知识图谱的推理系统只能扮演支持和辅助的角色,还不能完全有效保证推理结果的准确性和可靠性。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:王彩云总体设计并撰写论文、定稿;郑增亮提出研究思路及论文起草;蔡晓琼负责论文最终版本修改;苏前敏参与论文思路分析,论文修改指导;黄继汉参与论文思路指导。
Funding Statement
“十三五”国家科技重大专项(2018ZX09711001-009-011)
References
- 1.Hogan A, Blomqvist E, Cochez M, et al. Knowledge graphs. Synthesis Lectures on Data, Semantics, and Knowledge, Springer, 2022.
- 2.Lin J, Zhao Y, Huang W, et al Domain knowledge graph-based research progress of knowledge representation. Neural Computing and Applications. 2021;33(2):681–690. doi: 10.1007/s00521-020-05057-5. [DOI] [Google Scholar]
- 3.Abu-Salih B Domain-specific knowledge graphs: A survey. Journal of Network and Computer Applications. 2021;185:103076. doi: 10.1016/j.jnca.2021.103076. [DOI] [Google Scholar]
- 4.Yue D, Zhang K, Zhuang L, et al. Annotation scheme and specification for named entities and relations on Chinese medical knowledge graph//Chinese Lexical Semantics: 20th Workshop (CLSW), Beijing, 2019: 563–574.
- 5.Mohamed S K, Nováček V, Nounu A Discovering protein drug targets using knowledge graph embeddings. Bioinformatics. 2020;36(2):603–610. doi: 10.1093/bioinformatics/btz600. [DOI] [PubMed] [Google Scholar]
- 6.桑盛田, 杨志豪, 刘晓霞, 等 融合知识图谱与深度学习的药物发现方法. 模式识别与人工智能. 2018;31(12):1103–1110. [Google Scholar]
- 7.Korn D, Bobrowski T, Li M, et al COVID-KOP: integrating emerging COVID-19 data with the ROBOKOP database. Bioinformatics. 2021;37(4):586–587. doi: 10.1093/bioinformatics/btaa718. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 8.Al-Saleem J, Granet R, Ramakrishnan S, et al Knowledge graph-based approaches to drug repurposing for COVID-19. Journal of Chemical Information and Modeling. 2021;61(8):4058–4067. doi: 10.1021/acs.jcim.1c00642. [DOI] [PubMed] [Google Scholar]
- 9.Smith D P, Oechsle O, Rawling M J, et al Expert-augmented computational drug repurposing identified baricitinib as a treatment for COVID-19. Frontiers in Pharmacology. 2021;12:709856. doi: 10.3389/fphar.2021.709856. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 10.Zhang R, Hristovski D, Schutte D, et al Drug repurposing for COVID-19 via knowledge graph completion. Journal of Biomedical Informatics. 2021;115:103696. doi: 10.1016/j.jbi.2021.103696. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 11.Yan V K C, Li X, Ye X, et al Drug repurposing for the treatment of COVID-19: a knowledge graph approach. Advanced Therapeutics. 2021;4(7):2100055. doi: 10.1002/adtp.202100055. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 12.MacLean F Knowledge graphs and their applications in drug discovery. Expert Opinion on Drug Discovery. 2021;16(9):1057–1069. doi: 10.1080/17460441.2021.1910673. [DOI] [PubMed] [Google Scholar]
- 13.Bean D M, Wu H, Iqbal E, et al Knowledge graph prediction of unknown adverse drug reactions and validation in electronic health records. Scientific Reports. 2017;7(1):16416. doi: 10.1038/s41598-017-16674-x. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 14.Güvenç Paltun B, Kaski S, Mamitsuka H Machine learning approaches for drug combination therapies. Briefings in Bioinformatics. 2021;22(6):bbab293. doi: 10.1093/bib/bbab293. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.Du J, Li X A knowledge graph of combined drug therapies using semantic predications from biomedical literature: algorithm development. JMIR Medical Informatics. 2020;8(4):e18323. doi: 10.2196/18323. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 16.Li Y, Zhang T, Yang Y, et al. Artificial intelligence-aided decision support in paediatrics clinical diagnosis: development and future prospects. Journal of International Medical Research, 2020, 48(9): 300060520945141.
- 17.Chai X Diagnosis method of thyroid disease combining knowledge graph and deep learning. IEEE Access. 2020;8:149787–149795. doi: 10.1109/ACCESS.2020.3016676. [DOI] [Google Scholar]
- 18.Xie Y, Hu L, Chen X, et al Auxiliary diagnosis based on the knowledge graph of TCM syndrome. Computers Materials & Continua. 2020;65(1):481–494. [Google Scholar]
- 19.Zhang D, Jia Q, Yang S, et al Traditional Chinese medicine automated diagnosis based on knowledge graph reasoning. Computers Materials & Continua. 2022;71(1):159–170. [Google Scholar]
- 20.Song F, Wang B, Tang Y, et al. Research of medical aided diagnosis system based on temporal knowledge graph//International Conference on Advanced Data Mining and Applications. Springer, 2020: 236-250.
- 21.Wen H, Song J, Pan X Physician recommendation on healthcare appointment platforms considering patient choice. IEEE Transactions on Automation Science and Engineering. 2019;17(2):886–899. [Google Scholar]
- 22.Liu D, Ma Z, Zhou Y, et al. Intelligent hospital guidance system based on multi-round conversation//2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE, 2019: 1540-1543.
- 23.Yang Y, Rao Y, Yu M, et al Multi-layer information fusion based on graph convolutional network for knowledge-driven herb recommendation. Neural Networks. 2022;146:1–10. doi: 10.1016/j.neunet.2021.11.010. [DOI] [PubMed] [Google Scholar]
- 24.Wang Y A novel Chinese traditional medicine prescription recommendation system based on knowledge graph//Journal of Physics: Conference Series. IOP Publishing. 2020;1487(1):012019. [Google Scholar]
- 25.Gong F, Wang M, Wang H, et al SMR: medical knowledge graph embedding for safe medicine recommendation. Big Data Research. 2021;23:100174. doi: 10.1016/j.bdr.2020.100174. [DOI] [Google Scholar]
- 26.Chi Y, Yu C, Qi X, et al Knowledge management in healthcare sustainability: a smart healthy diet assistant in traditional Chinese medicine culture. Sustainability. 2018;10(11):4197. doi: 10.3390/su10114197. [DOI] [Google Scholar]
- 27.朱超宇, 刘雷 基于知识图谱的医学决策支持应用综述. 数据分析与知识发现. 2020;4(12):26–32. [Google Scholar]
- 28.Shang Y, Tian Y, Zhou M, et al EHR-oriented knowledge graph system: toward efficient utilization of non-used information buried in routine clinical practice. IEEE Journal of Biomedical and Health Informatics. 2021;25(7):2463–2475. doi: 10.1109/JBHI.2021.3085003. [DOI] [PubMed] [Google Scholar]
- 29.Wang L, Xie H, Han W, et al Construction of a knowledge graph for diabetes complications from expert-reviewed clinical evidences. Computer Assisted Surgery. 2020;25(1):29–35. doi: 10.1080/24699322.2020.1850866. [DOI] [PubMed] [Google Scholar]
- 30.Xiong W, Cao J, Zhou X, et al Design and evaluation of a prescription drug monitoring program for chinese patent medicine based on knowledge graph. Evidence-Based Complementary and Alternative Medicine. 2021;2021:9970063. doi: 10.1155/2021/9970063. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 31.Chu J, Chen J, Chen X, et al Knowledge-aware multi-center clinical dataset adaptation: problem, method, and application. Journal of Biomedical Informatics. 2021;115:103710. doi: 10.1016/j.jbi.2021.103710. [DOI] [PubMed] [Google Scholar]
- 32.Sun Z, Yin H, Chen H, et al Disease prediction via graph neural networks. IEEE Journal of Biomedical and Health Informatics. 2020;25(3):818–826. doi: 10.1109/JBHI.2020.3004143. [DOI] [PubMed] [Google Scholar]
- 33.Pham T, Tao X, Zhang J, et al Graph-based multi-label disease prediction model learning from medical data and domain knowledge. Knowledge-Based Systems. 2022;235:107662. doi: 10.1016/j.knosys.2021.107662. [DOI] [Google Scholar]
- 34.Wang S, Xu F, Li Y, et al KG4SL: knowledge graph neural network for synthetic lethality prediction in human cancers. Bioinformatics. 2021;37:i418–i425. doi: 10.1093/bioinformatics/btab271. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 35.Teng F, Yang W, Chen L, et al Explainable prediction of medical codes with knowledge graphs. Frontiers in Bioengineering and Biotechnology. 2020;8:867. doi: 10.3389/fbioe.2020.00867. [DOI] [PMC free article] [PubMed] [Google Scholar]