论文日报 | DearLLM：基于大语言模型推理特征相关性增强个性化医疗预测

程序猿李巡天

376人浏览 · 2026-04-28 21:40:09

程序猿李巡天 · 2026-04-28 21:40:09 发布

论文导读：

在个性化医疗预测中，准确识别各项医疗特征（如不同的诊断代码）之间的内在联系对于提取病人的健康模式至关重要。这篇论文针对现有深度学习模型在医疗数据稀疏、样本有限的情况下难以自动学习到有效特征关联的问题，创新性地提出了一种利用大语言模型作为知识库来推理特征间定量相关性的思路。研究团队开发了名为 DearLLM 的新型框架，该框架通过计算大语言模型在特定病人背景下的推理困惑度，精确地捕捉并学习医疗特征间的强弱关系，并结合一种关注特征频率的图形池化方法，优先提取对个体病人最具价值的健康信息。在 MIMIC-III 和 MIMIC-IV 两个真实世界的权威医疗数据集上的实验表明，DearLLM 在死亡率预测等任务上显著优于现有的前沿模型，且其挖掘出的特征关联与医学文献高度一致，具有极强的临床解释力。

1引言

随着电子病历系统的广泛普及，利用深度学习技术分析这些海量医疗记录来优化治疗方案已成为趋势。然而，医疗数据通常非常稀疏且带有明显的个体差异，纯数据驱动的模型往往因为缺乏足够的标注样本而难以理清各种复杂疾病之间的潜在逻辑，这在科学界被称为搜索假设空间过大的挑战。

为了解决这一难题，以往的研究尝试引入外部医学知识图谱。但这些传统方法存在两个明显的局限性：一是灵活性不足，往往只能提取固定的定性关系（如“A病与B病相关”），无法区分相关性的强弱；二是忽视了个性化差异，容易在处理海量共有信息时，掩盖了那些虽然出现频率低但对特定病人至关重要的核心健康信号。因此，开发一种既能精准量化特征关联，又能紧扣病人独特背景的预测模型显得迫切且必要。

2 模型

该论文提出的 DearLLM 模型主要由四个核心环节组成，形成了一个从原始数据到智能预测的闭环流程。

第一部分是特征提取器。它就像是一个精敏的“观察者”，将病人长期的电子病历序列作为输入，利用递归神经网络或 Transformer 等架构，把这些复杂的历史记录转化成包含时间规律的隐藏向量，初步刻画病人的健康状态基础。

第二部分是特征关联图的构建与学习，这是模型最核心的创新点。系统首先根据病人的历史门诊信息和时间间隔编写一段自然语言描述，作为大语言模型的背景约束。随后，模型会向大语言模型提出特定的医学关联问题。通过计算大语言模型在回答这些问题时的“困惑度”指标——即预测某个词出现的概率，来定量衡量两种医疗特征间的关联强度。困惑度越低，代表大语言模型认为这两个特征在当前病人背景下关联越紧密。这些量化的数值随后被转化成一张带权重的有向图，并输入到图卷积网络中，通过多层信息的传递和融合，深度挖掘特征间的高阶逻辑关系。

第三部分是基于频率感知的图池化处理。为了不让通用的医学常识掩盖个体病人的独特性，模型引入了类似于文本搜索中的权重计算机制。它会评估每一个医疗特征在当前病人病历中的出现频率与在全体人群中出现频率的比例。对于那些在特定病人身上反复出现、但在普通人群中并不常见的特征，模型会赋予更高的权重。通过这种方式，模型能更精准地“聚焦”于最能代表该病人独特健康风险的信号。

第四部分是预测器。最后，模型将第一部分得到的病人状态向量与第三部分提取出的加权知识表示拼接在一起，输入到最终的全连接神经网络层。经过处理后，模型输出一个具体的概率值，从而实现对病人未来健康风险（如死亡率）的精准预测。

3实验

评价指标：AUPRC、AUROC、F1

性能比较**：**

4结论

该论文提出的 DearLLM 模型，通过大语言模型推理定量特征相关性和频率感知的图池化方法，解决了医疗数据稀疏以及传统知识引入方法缺乏灵活性和个性化的问题，达到了在个性化医疗预测任务中性能大幅提升的效果。实验证明，该方法不仅能有效降低模型学习的不确定性，还能够提供符合临床医学逻辑的解释，为智能医疗决策支持提供了新的技术路径。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

让安全驾驶有“AI”相伴｜腾视科技DMS视频监控一体机，守护每一次出行

AtomGit开源社区

具身智能商业化提速：天问机器人六大业务板块数据全景扫描

科普教育业务方面，天问机器人整合行业资源与技术优势，开发系列科普教育内容，包括机器人科普讲座、AI知识手册、科普短视频、互动体验课程等，语言通俗易懂、形式生动有趣，适配不同年龄段、不同知识背景人群。同时组建专业科普讲师团队，走进校园、社区、企业开展科普活动。专业维修服务覆盖人形机器人、四足机器人、导览机器人、安防机器人、教育机器人等全品类设备，建立"7×24小时响应—远程诊断—现场维修—定期保养"

AtomGit开源社区

Agent 与 Chat 的区别及常见工具详解

Chat 是一种基于大语言模型的对话系统，其核心能力是理解用户输入并生成自然、连贯的文本回复。它通常采用“一问一答”的交互模式，模型根据上下文和训练数据中的知识进行推理和生成。Chat 的主要特点：被动响应：通常等待用户提问或下达指令后才做出反应。单次或短上下文交互：虽然支持多轮对话，但每次回复主要依赖当前对话窗口内的上下文。无自主行动能力：Chat 本身无法调用外部工具、访问实时数据或执行代码，