AI赋能中医古籍:智慧传承与创新应用
AI赋能中医古籍:智慧传承与创新应用
邹晓辉0000-0002-5577-8245

1 引言:中医古籍数字化的转折点
中医古籍作为中华民族独特的医学智慧载体,其传承方式正经历从传统师徒相授到人工智能深度赋能的历史性转变。《黄帝内经》《伤寒论》《本草纲目》等经典蕴含着千年的理论体系和临床经验,然而这些古籍的术语不统一、文献零散以及辨证体系复杂等特点,长期以来,制约着其现代化发展与广泛传播。据不完全统计,现存中医药古籍超过8000种,其中许多因年代久远面临纸张脆化、字迹模糊等问题,正以惊人速度消亡。更令人忧心的是,能准确解读这些古籍的专家日益减少,大量珍贵知识面临失传风险。
人工智能技术的迅猛发展为中医古籍的传承与创新提供了全新解决方案。通过自然语言处理、知识图谱、生成式AI等前沿技术手段,中医古籍的智慧正被系统性地挖掘、结构化与活化利用。传统的人工整理方式效率低下且成本高昂,一位资深中医专家可能需要数月时间才能完成一部古籍的校注工作,而AI技术可以在几小时内处理数百万字的文本,通过深度学习识别古汉字准确率可达95%以上。这种效率的飞跃,使得大规模抢救性数字化成为可能,为中医古籍保护与利用开辟了新路径。
中医古籍数字化不仅关乎文化遗产的保存,更是中医药现代化发展的核心驱动力。随着全球对中医药认可度的不断提升,世界卫生组织已将传统医学纳入国际疾病分类体系,这对中医古籍知识的系统梳理与现代解读提出了迫切需求。AI技术在这一过程中扮演着关键角色,它能够突破人类认知的局限,从海量古籍文本中发现潜在规律,建立古今知识的桥梁,从而使千年智慧在当代医疗健康领域中焕发新的生机。
2 AI驱动的中医古籍知识重构
2.1 古籍文本的智能解析与知识抽取
面对中医古籍语言晦涩、术语不统一的挑战,研究者已开发出多种专门化技术方法,以实现知识的有效抽取。其中,BSTR-GPRel框架集成预训练语言模型与全局指针机制,通过多层架构实现古籍实体关系的统一建模,在《汤液本草》《神农本草经》等典籍上的实验显示,其F1值达到0.785,显著提升了对关系重叠等复杂语义场景的处理能力。这一技术突破,为构建高质量本草知识图谱提供了可靠支撑,使中医古籍中的药物属性、功效关系等知识点能够被准确抽取和结构化。
表1:中医古籍知识抽取技术比较
技术方法 核心原理 适用典籍 抽取效果(F1值)
BSTR-GPRel框架 预训练语言模型+全局指针机制 《汤液本草》《神农本草经》等 0.785
传统NLP方法 规则匹配+词典 各类中医古籍 0.65左右
联合抽取模型 神经网络关系抽取 《伤寒论》《金匮要略》 0.72
生成式AI在训练数据生成方面展现出独特价值。针对中医古籍文本相似度计算中数据标注成本高昂的问题,张君冬等人创新性地利用生成式AI生成全部任务数据,再结合SimCSE方法,构建了专门适用于中医古籍文本的相似度计算模型。研究结果显示,引入AI生成的正负样本对后,模型性能明显提升,TCM-Gujiroberta模型性能最佳达到90.9%。这种方法有效解决了BERT在中医古籍文本上语义表征困难的问题,为古籍语义理解提供了新思路。
2.2 多维度知识图谱的构建与应用
知识图谱技术已成为中医古籍知识系统化管理的核心工具。研究者围绕"四大经典"构建知识图谱,涵盖疾病、症状、方剂、中药及其历史和地域背景等多维度信息。例如,陶晓华团队基于KG技术构建的"病脉证并治"语义网络,实现对《伤寒论》《金匮要略》等古籍的系统解析,为"据证立法"提供可视化决策依据。这种结构化表达不仅使古籍知识更加系统化,还为实现智能问答和个性化学习推荐奠定了基础。
大规模方剂知识图谱的构建,尤为引人注目。一项研究成功构建了包含46,600余条古方、超过120,000个实体、415,900个三元组和12类关系的中医方剂知识图谱。该图谱采用HAKE模型进行嵌入表示学习,将实体映射到极坐标系,区分语义层次,支持两种重定位路径即:一是基于方剂名称检索功效相似方剂,二是基于症状集合推荐可能方剂。这种深度知识网络使"方剂-症状"间的复杂关联变得可计算、可推理,极大提升了古籍知识的可用性。
知识图谱在临床中的应用也取得显著进展。张卫东等借助知识图谱工具,将中医古籍《金匮要略》转化为结构化知识单元,构建了包含6个节点表组和8个关系表组的逻辑数据集,并形成了1,283个实体和7,710个三元组的知识图谱。这不仅实现了文本电子化,避免因虫蛀、潮湿、光照等物理损坏导致知识永久丢失,更使古籍知识成为可查询、可推理的智能资源。
3 智能诊疗:从古籍理论到临床实践
3.1 辨证模型的数字化构建
中医辨证论治的个性化诊疗特点正在通过人工智能技术实现数字化转化。孙光荣教授提出的"中医辨治六步程式"为智能辨证提供完整闭环,适合与深度学习、自然语言处理和知识图谱结合,推动中医数字化与标准化转型。智能辨证模型已利用Transformer和长短时记忆网络等算法对大规模医案和经典文献进行特征抽取,高效解析并标准化复杂证候关系,为"审证求因"和"求因明机"环节提供技术支持。
多智能体系统与知识图谱的融合进一步增强了辨证推理的准确性。这种融通融合能够更好地处理古籍中复杂的辨证逻辑,如六经辨证、卫气营血辨证等不同体系间的关联与差异,使AI系统能模拟中医专家的辨证思维过程。由此构建的辨证模型不仅包含症状与证候的对应关系,还融入了病机演变规律和治疗原则,形成更加完整的辨证论治体系。
在具体应用方面,中国中医科学院广安门医院开发的"广医岐智"大模型集成了院内优秀临床病例数据以及中医名师临床经验,构建了涵盖疾病、中药、古籍文献等22个大类、407万病例数据,包含中药、中医疾病、中医特色知识库等9类、1400万条临床知识库体系。该模型采用本地化部署模式,数据仅在院内封闭运行,既充分发挥了AI的辅助诊疗能力,又充分保护了医患隐私。
3.2 智能四诊技术的突破
AI技术推动中医望、闻、问、切四诊信息的客观化采集与分析。智能舌诊仪利用图像识别技术,可识别舌质颜色、舌苔厚度等30余项特征,在1000例临床测试中,对湿热证的诊断准确率达88%。智能声诊仪通过分析咳嗽声频,区分风寒、风热咳嗽的准确率为85%。而穿戴式脉象手环采集的脉象数据,经AI算法分析,可以判断脉象的弦、滑、涩等特征,在高血压患者监测中,辅助诊断符合率达83%。
表2:智能四诊设备性能对比
设备类型 技术原理 应用场景 准确率/效率
智能舌诊仪 图像识别技术 湿热证诊断 准确率88%
智能声诊仪 声频分析 咳嗽类型区分 准确率85%
智能问诊机器人 自然语言处理 症状信息收集 问诊时间缩短至5分钟
穿戴式脉象手环 AI算法分析 脉象特征判断 辅助诊断符合率83%
未来研究方向包括结合柔性复合传感器、条件扩散模型以及知识图谱增强学习,推动脉象的全面建模与跨中心验证,提升智能脉诊的临床适用性。这类技术将古籍中抽象的脉诊描述,转化为可量化的数据指标,使《频湖脉学》等古籍中的脉诊理论,得以可视化、可操作化,大大降低了脉诊学习门槛。
名医数字人是智能诊疗的另一重要突破。利用NLP和AI技术,系统化地整理、分析和学习名老中医的诊疗逻辑、用药规律、临证医案,形成可以复用的数字化知识库,建立可传承的决策模型。例如,"黄煌经方AI专家系统",通过构建结构化、标准化的中医药大数据库,深入还原著名中医学家黄煌教授的经方思想,模拟其开方流程,辅助医生的临床决策。这种"数字名师"模式,使得名老中医的经验能够突破时空限制,惠及更多医者和患者。
4 古籍方剂的深度挖掘与创新应用
4.1 方剂知识发现与数据挖掘
基于古籍方剂的数据挖掘,揭示了传统方剂的现代科学内涵。研究表明,对《本草纲目》等古籍的文本分析,利用自然语言处理技术提取中药功效、配伍关系等信息,已识别出超200种中药的潜在新用途。在临床病案方面,对5000例冠心病中医诊疗病案,进行挖掘,通过机器学习算法,发现,胸闷、气短等症状组合与心脉痹阻证型的关联度高达82%,且常用方剂中活血化瘀类药物使用频率占比65%。
知识图谱技术为理解方剂作用机制,提供了新视角。如TCMBank数据库构建的知识图谱,涵盖9192种草药、61,966种化学成分、15,179个靶点及32,529种疾病。研究团队基于知识图谱分析黄芪的作用机制,发现其通过调节PI3K-Akt信号通路,在心血管疾病治疗中发挥关键作用,为黄芪新药研发提供了理论依据。这种方法将古籍中记载的药物功效与现代分子生物学联系起来,为中药现代化研究搭建了桥梁。
在方剂重定位研究方面,基于知识图谱与链接预测算法的新型模型,支持两种重定位路径:一是基于方剂名称检索功效相似方剂("方剂→方剂"),二是基于症状集合推荐可能方剂("症状→方剂")。实验以复方丹参片和COVID-19相关症状为例,进行验证,推荐结果与现有临床实践高度一致,表明该模型可用于中医复方新适应症发现与多组分药物研发支持。
4.2 知识问答系统的构建与应用
基于大型语言模型的中医古籍知识问答系统极大提升了知识获取效率。以《伤寒论》等中医古籍为数据来源,结合古籍的目录结构,通过ChatGLM提取古籍中的方剂信息,可以构建中医古籍方剂检索系统。进一步利用Apriori、association_rules等数据挖掘算法,以及Echart、Pyvis等知识图谱工具,可以实现中医古籍挖掘及知识图谱可视化展示,构建基于大型语言模型的中医古籍方剂数据挖掘系统。
检索增强生成技术的应用,进一步提升了问答系统的准确性与实用性。以BISHENG平台为工具,以抽取方剂信息为来源,可以构建基于检索增强生成的中医古籍方剂知识问答系统。这类系统能理解自然语言提问,直接从未结构化的古籍文本中提取相关信息并生成简洁答案,大大降低了古籍知识获取的门槛,促进了中医知识的普及与传播。
专用于中医领域的大语言模型开发取得重要进展。Huang-Di大模型在Ziya-LLaMA-13B-V1开源模型基础上,通过继续预训练、有监督微调、DPO优化的全流程训练步骤构建。自动评估结果表明:训练损失函数成功收敛,各对话类目下BLEU、ROUGE指标值,均偏低,侧面反映出该模型具备强大的领域创造力。人工评估结果显示:该模型在古籍知识问答方面性能显著优于现有的中医药垂直领域两类模型。
5 挑战与展望
5.1 当前面临的技术与伦理挑战
尽管AI赋能HI中医古籍研究取得显著进展,仍面临诸多挑战。首要问题是专业语境误读与知识幻觉风险。中医药古籍文献以文言文为载体,即便是现代中医专业文本,也存在大量专业术语与语境化表达,同一词汇在不同病症、不同配伍中可能存在截然不同的含义。AI模型缺乏中医药专业的语境感知能力,易出现语义误读、概念误用等问题。大语言模型固有的"知识幻觉"问题,在中医药这一专业领域被进一步放大——模型可能生成语法通顺、逻辑看似自洽,但完全违背中医药理论与临床实践的错误内容。
数据质量与标准化不足,也是制约AI模型性能的关键因素。现代中医学派繁多、论述体系不一,进一步加大了中医数据标准化的难度。中医经典著作往往使用古汉语、类比式思维和隐喻语言进行论述,语言形式多样,且缺乏统一的术语标准,这使得传统自然语言处理技术在解析中医古籍、医案时难以胜任。
在伦理层面,流量逻辑对专业公共性的侵蚀值得警惕。健康传播的核心准则,是坚守科学性、准确性与公益性,其首要目标是向公众传递准确的健康知识。但在平台的传播生态中,算法的核心优化目标是用户停留时长与商业变现效率,流量至上的逻辑,通过AI工具的规模化应用被进一步放大,极易导致中医药传播的逻辑异化。
5.2 未来发展趋势与展望
未来AI赋能中医古籍将呈现三大趋势:多模态知识融合、动态知识演化以及人机协同创新。多模态知识融合指整合文本、图像、临床数据等多源信息,构建更加全面的中医知识体系。动态知识演化关注揭示中医理论的历史演变规律,理解其发展脉络。人机协同创新强调结合AI的计算能力与人类专家的临床经验,形成互补优势。
AIGC技术将在中医古籍活化中发挥更大作用。通过生成式AI技术不仅可以实现古籍知识的智能问答,还能进行古籍内容的创造性重组与新知识发现。这类技术将帮助研究者从不同角度理解古籍内涵,发现前人未能察觉的知识关联,促进中医理论的创新性发展。
在实践层面,数字孪生与元宇宙技术可能为中医古籍研究开辟新路径。例如,融合数字孪生的名中医诊疗全过程生成智能方法及智慧传承平台研发,能够创建虚拟的古籍学习环境,使研究者能够沉浸式体验古籍中记录的医学场景。这种创新方法将极大提升古籍学习的体验感和互动性,促进知识的深度理解与消化。
全球医疗生态构建是AI赋能中医古籍的终极目标。通过数字科技推动中医药的全球化进程,使其更好地融入全球医疗体系,为人类健康贡献中国智慧。这需要加强国际合作,建立统一的标准和规范,促进中医药知识的国际传播与认可。
参考文献
1.科技赋能中医古籍精华传承与创新应用
2.人智协同视域下中医古籍智慧服务模式与实现逻辑研究
3.AIGC赋能中医古籍活化:Huang-Di大模型的构建
4.基于知识元理论与临床需求深度融合的中医古籍数智化研究路径和范式
5.面向中医古籍的知识抽取研究进展
6.AIGC赋能中医古籍活化:Huang-Di大模型的构建
7.当千年智慧遇上AI:中医古籍数字化如何开启传统医学新纪元?
8.以AI之笔绘中医药发展新卷
9.智赋中医药传承创新三重奏
10.中医药数智化发展的成效、困境与路径探索
11.生成式人工智能赋能中医药健康传播的实践、困境与路径
12.依托中医国粹 打造“超强”AI
13.AI赋能中医药文化传承与创新
14.當漢代醫簡遇見AI 成都中醫大推動醫學文獻文物數字活化
15.科学网—人工智能赋能中医药的进展、挑战与展望
16.古籍整理数字化:中医药学术传承的密钥
17.人工智慧也可“望聞問切”
18.中医古文相似度计算研究:一种以生成式AI融合领域知识的SimCSE方法
19.嵌套实体识别+层次嵌入:AI如何为46,600首古方构建“语义知识图谱”?
20.数字科技下的中医药范式重构:技术赋能与全球医疗新生态
论文的主要内容如下:
引言背景:介绍中医古籍的价值与传承挑战,以及AI技术带来的革新机遇,使用文献引证说明现状。
知识重构:分析AI在古籍文本解析和知识图谱构建中的技术方法与应用效果,用表格对比不同技术。
智能诊疗:探讨AI在辨证模型数字化和智能四诊技术中的突破,用表格展示设备性能对比。
方剂挖掘:总结AI在方剂知识发现和知识问答系统构建中的成果,分点说明应用场景。
挑战展望:分析当前技术瓶颈和未来多模态融合、人机协同等发展趋势,分条列举关键问题。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)