人工智能中的记忆：关键好处与投资考虑

布客飞龙

394人浏览 · 2026-05-17 00:16:59

布客飞龙 · 2026-05-17 00:16:59 发布

原文：towardsdatascience.com/the-important-role-of-memory-in-agentic-ai-896b22542b3e?source=collection_archive---------15-----------------------#2024-06-18

记忆将成为显著提高人工智能系统性能的关键因素——无论是在准确性还是效率方面

https://medium.com/@sandibesen?source=post_page---byline--896b22542b3e--------------------------------https://towardsdatascience.com/?source=post_page---byline--896b22542b3e-------------------------------- Sandi Besen

·发表于 Towards Data Science ·5 分钟阅读·2024 年 6 月 18 日

–

就像人类依赖记忆做出明智的决策和得出合乎逻辑的结论一样，人工智能也依赖其检索相关信息、理解上下文和从过去经验中学习的能力。本文深入探讨了为什么记忆对人工智能至关重要，探索了它在回忆、推理和持续学习中的作用。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0300026eea8f0efe2791300fde5612c2.png

色彩斑斓的大脑与代表记忆的微芯片来源：DALLE3

记忆在回忆中的作用

有些人认为扩大上下文窗口将提升模型性能，因为这使模型能够摄取更多信息。虽然在某种程度上这是正确的，但我们目前对于语言模型如何优先考虑上下文的理解仍在发展。事实上，研究表明，“当相关信息出现在输入上下文的开头或结尾时，模型性能最高。”[1] 上下文窗口越大，我们越有可能遇到著名的“迷失在中间”问题，即由于重要信息被埋藏在中间，模型无法回忆起特定的事实或文本[2]。

为了理解记忆如何影响回忆，考虑人类是如何处理信息的。当我们旅行时，我们会被动地听到很多公告，包括航空公司广告、信用卡优惠、安全简报、行李领取信息等。我们可能没有意识到我们吸收了多少信息，直到我们需要回忆相关内容时。例如，如果一个依赖于检索相关信息来回答问题的语言模型，而不是依赖固有知识，被问到“紧急迫降时我该怎么做？”时，它可能无法回忆出回答这个重要问题所需的相关细节，因为检索了太多的信息。然而，拥有长期记忆的模型可以存储和回忆最关键的信息，从而在适当的上下文中进行更有效的推理。

记忆在推理和持续学习中的作用

记忆提供了重要的上下文，使模型能够理解过去解决问题的方法，识别哪些方法有效，哪些需要改进。它不仅提供了重要的上下文；还使模型能够回忆出先前用于解决问题的方法，识别成功的策略，并找出需要改进的领域。这一改进反过来有助于模型在复杂的多步骤任务中进行有效的推理。如果缺乏足够的推理能力，语言模型将难以理解任务，无法逻辑性地思考目标，解决多步骤问题，或者使用适当的工具。你可以阅读我上一篇文章中关于推理和高级推理技术的重要性的内容，点击这里。

以手动在公司数据仓库中查找相关数据为例。那里有成千上万的表格，但由于你理解需要哪些数据，因此可以专注于一个子集。经过数小时的搜索，相关数据被找到了，分布在五个不同的表格中。三个月后，当数据需要更新时，必须重复搜索过程，但你可能记不起曾用过的 5 个源表格来生成这个新报告。手动搜索过程再次重复。如果没有长期记忆，语言模型可能会以相同的方式解决这个问题——凭借蛮力——直到找到相关数据来完成任务。然而，配备了长期记忆的语言模型可以存储初始的搜索计划、每个表格的描述以及基于每个表格的搜索结果所修订的计划。当数据需要更新时，它可以从之前成功的方法开始，从而提高效率和性能。

这种方法使系统能够随着时间的推移不断学习，持续修订任务的最佳方法，积累知识，从而生成更高效、性能更强的自主系统。

评估将长期记忆纳入您的 AI 解决方案的投资

将长期记忆纳入 AI 系统中，可以显著提升其能力，但是否值得为这种能力进行必要的开发投入，需要慎重考虑。

1. 理解任务的性质

复杂性和持续时间：如果您的任务涉及复杂的多步骤过程或需要长期保存信息，长期记忆可以提高效率和准确性。例如，项目管理应用中，任务可能跨越数月，通过 AI 的记忆和从之前的上下文和迭代中获得的适应能力，可以带来益处。
上下文敏感性：依赖于上下文理解的任务，如客户服务互动、营销个性化或医疗诊断，可以利用长期记忆提供更个性化的响应。例如，IT 帮助台助手可以从记住客户是否曾遇到过这个问题以及如何在之前的互动中解决中获益。

2. 评估数据的量和变化性

高数据量：如果您的应用需要定期引用大量数据，长期记忆可以避免重复处理相同的信息，从而节省时间和计算资源。
数据变化性：在数据频繁变化的环境中，长期记忆有助于保持 AI 更新最新信息，从而确保更准确的输出，而无需重新训练。

3. 评估成本效益比

平衡成本与性能收益：实施长期记忆可能需要大量资源，并且随着记忆的积累，需求将不断增长。重要的是权衡数据存储的财务投资与可能的性能提升之间的关系。对于小型企业或资源有限的应用，具备长期记忆的小型语言模型（SLMs）可能提供一个更为平衡的解决方案。
竞争优势：通过提高 AI 应用的效率和效果，长期记忆可以提供显著的竞争优势，使企业能够提供比那些使用传统无记忆功能模型的企业更优质的服务。

4. 解决安全性和合规性问题

数据隐私：长期记忆涉及存储更多数据，这可能引发隐私问题。确保您的系统符合数据保护规定，并且敏感信息遵循最佳安全实践。

本质上……

将长期记忆融入 AI 系统为提升其能力提供了重大机会，通过提高准确性、效率和上下文理解能力。然而，决定是否投资这一能力需要仔细考虑并进行成本效益分析。如果战略性地实施，长期记忆的引入能够为你的 AI 解决方案带来实际的好处。

有问题或者认为某些内容需要进一步澄清吗？请在Linkedin上给我发私信！我总是渴望参与深度思考并对我的工作进行迭代。我的工作并不代表我雇主的观点。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

01 大语言模型导论：从语言模型到通用智能接口

语言模型，英文是，简称 LM。最简单地说，语言模型要解决的问题是：给定前面的文本，预测后面最可能出现的词或 token。例如给定一句话：今天天气很好，我想出去语言模型可能会预测下一个词是：散步也可能是：跑步或者：玩从数学上看，语言模型本质上是在建模一个序列的概率。假设一句话由多个 token 构成：那么语言模型希望计算整个序列出现的概率：根据概率链式法则，可以写成：这个公式的意思是：一个句子的概率

AtomGit开源社区

2026 年 Qwen3.5-Omni 与 Qwen3.6 全模态模型深度技术解析

2026 年 3 月 31 日，通义千问团队正式推出全模态大模型 Qwen3.5-Omni，凭借在 215 项国际基准测试中取得的领先成绩、出色的成本控制能力以及突破性的音视频编程功能，迅速在全球开发者社区引发广泛关注。时隔不久，Qwen3.6 系列模型作为迭代升级版本正式发布，在性能表现、多模态融合精度以及生态系统适配性等方面实现了全方位提升，进一步巩固了其在国产全模态模型领域的领先地位。

AtomGit开源社区

剑星-完全破解版2026最新官方正版免费下载一键转存永久更新（看到速转存资源随时走丢）

《剑星》技术解析：虚幻引擎下的ARPG工业化实践韩国SHIFTUP工作室开发的《剑星》展现了虚幻引擎在ARPG领域的深度应用。游戏采用3D扫描管线构建角色模型，定制次表面散射着色器提升材质表现，并通过粘土扫描技术实现怪物设计。核心玩法基于帧状态判定系统，包含精确的碰撞检测和动画混合空间设计，配合复杂的行为树AI系统。技术对比显示，《剑星》在画面表现上优于《只狼》，动作质量感强于《尼尔》。多线程渲