界面新闻:《APUS智草大模型发布:中医药与人工智能的完美融合》;上观新闻:《饱读700+中医古籍!MCM多模态问诊模型升级你的“互联网看病”体验》;和讯网:《华为云探路AI制药:大模型让药物设计效率提升33%,实现中医智能化问诊》……这还仅仅是这半个月来关于“中医”和“大模型”的有关新闻报道,可见,AI技术正以不可阻挡的势头渗入各个领域,但在这样汹涌的势头下,中医大模型能够解决什么问题?或者说面对开发中医大模型的过程,医学界和技术界更加关注什么?今天,我们结合自己开展的研究工作《Acupuncture indication knowledge bases: meridian entity recognition andification based on ACUBERT》为大家带来具体分析。
在针灸诊断和治疗中,非量化的临床描述限制了标准化治疗方法的发展。本研究探讨了使用针灸双向编码器表示模型(ACUBERT)对针灸主治病症中经络实体识别和分类效果及其差异原因。在研究过程中,我们从82本针灸医学书籍中选取了54,593个不同的实体作为医学文献的预训练语料,利用BERT模型对中医文献进行分类研究。此外,我们还采用了支持向量机和随机森林模型作为比较基准,并通过参数调优进行了优化,最终开发出了ACUBERT模型。结果表明,ACUBERT模型在分类效果上优于其他基线模型,在第5轮训练时表现最佳。模型的“精确度”、“召回率”和F1分数均达到了0.8以上。此外,我们的研究具有一个独特的特点:它基于八纲辨证和脏腑辨证作为基础标签,训练了经络辨证模型,建立了具有中医特色的针灸指征知识库(ACU-IKD)和ACUBERT模型。总之,ACUBERT模型显著提升了针灸指征数据库中经络归属的分类效果,并展示了基于BERT的深度学习方法在多类别、大规模训练集中的分类优势。
1. 数据问题:
数千年的历史如何回溯?
中医大模型需要大量的高质量数据作为支撑,包括中医典籍、临床案例、患者症状体征等信息。然而,目前中医领域的数据存在标注不准确、信息不完整、数据格式不统一等问题,这直接限制了模型的训练和验证效果。不如不同朝代对同一疾病的名称描述有诸多不同,甚至因为缺字漏字导致了关键信息的缺失,这些在人类医生的学习过程中可以通过“顿悟”发现的问题,在计算机的模型中却未必能够得到补全。
此外,如何有效地获取和共享中医相关数据是另一个挑战。需要建立完善的中医数据共享平台,推动数据开放和流通,以支持模型的持续优化——但目前面临的问题是,结构化最好的医学数据来源:电子病历,处于封闭化管理的His系统中,较为开放的临床医案却结构化不佳,这是中医大模型和医学大模型研究不能回避的问题之一。
2. 技术问题:大模型的幻觉如何“洗脱”?
中医大模型的构建涉及复杂的算法和模型设计,需要不断探索和优化以提高模型的准确性和可靠性。此外,模型还需要具备处理多模态数据(如文本、图像等)的能力,以更全面地分析患者的病情——我们在中医领域经常听到一句话“但见一证便是”,很多经过短期训练的医生也能做到对某一组症状特别敏感——这就是中医的“证”的概念,然而,很多判断证型的过程结合的不仅仅是医生当下的感受,更是系统的医学知识,大模型虽然能做到遵循规则,却很难做到“随机应变”,因而——知识图谱和深度学习是中医大模型开发中的关键技术路径。如何将中医知识图谱与深度学习技术有效结合,提升模型的语义理解和推理能力,是亟待解决的问题——而这里面的基础工作,就像是我们所做的这一类,对来自时间跨度一千多年的80多部中医医籍里涉及针灸经络辨证的表述进行系统分类,而这仅仅是构建一个宏大的中医大模型的一小步。
3. 模型应用问题:计算机究竟能不能开处方?
中医大模型需要在临床实践中进行验证和优化,以确保其在实际应用中的有效性和安全性。这要求模型具备高度的可解释性和可操作性,以便医生能够理解和接受其诊断建议和治疗方案——正如我们初步完成的对于经络辨证的分类模型,解决了中医师在描述疾病发病特点的部分过程的计算机量化,而全面应用的模型,不仅要完成分类、描述、处方乃至治疗的过程,更重要的是这些过程应该是可以解释的,可以得到相对公认的,但显然,纵使是现代医学中的具体经验,也难以全部得到完美的定量的诠释,这为大模型在医学领域的应用造成了一定风险。中医大模型不仅应局限于临床诊断和治疗方案的制定,还应拓展到药物研发、疾病预防等多个领域。这需要模型具备更广泛的适应性和灵活性。具体来说——ACUBERT模型在分类效果上优于其他基线模型,在第5轮训练时表现最佳。模型的“精确度”、“召回率”和F1分数均达到了0.8以上,而这依然是科研场景下的结果,真实的临床或许要要求相关指标达到90%以上,而患者的要求或许是100%——这就要求大模型不仅要具备对单一类型数据的分类鉴别能力,更需要结合图像、文本乃至声音等系列素材,开展详细而系统的分析,事实上,这甚至超过了对普通医学生的要求,虽然有很多模型可以“通过”执业医师资格考试,但是,这更多是一种对文本的理解和记忆能力,更加复杂的面向临床的功能,依然处于实验室阶段。
4. 人才培养问题:跨学科人才有待培育
中医大模型的开发需要既懂中医又懂AI的复合型人才。然而,目前这类人才相对匮乏,需要加强人才培养和学科交叉,以满足中医大模型开发的需求。对医学生而言,这一点本身已经非常困难,在类似于“高三”的学习强度和课业安排下,再学习一门编程是极高的要求,而对计算机学科的从业者而言,如何理解基于中国传统哲学的中医,也是一门费时费力的工作,但这不意味着,这件事情我们无法去做,最后引用这一段著名演讲的节选:
We choose to go to the moon in this decade and do the other things, not because they are easy, but because they are hard, because that goal will serve to organize and measure the best of our energies and skills, because that challenge is one that we are willing to accept, one we are unwilling to postpone, and one which we intend to win, and the others, too.
我们决定在这十年间登上月球并实现更多梦想,并非它们轻而易举,而正是因为它们困难重重。因为这个目标将促进我们实现最佳的组织并测试我们顶尖的技术和力量,因为这个挑战我们乐于接受,因为这个挑战我们不愿推迟,因为这个挑战我们志在必得,其他的挑战也是如此。