原文:towardsdatascience.com/the-important-role-of-memory-in-agentic-ai-896b22542b3e?source=collection_archive---------15-----------------------#2024-06-18

记忆将成为显著提高人工智能系统性能的关键因素——无论是在准确性还是效率方面

https://medium.com/@sandibesen?source=post_page---byline--896b22542b3e--------------------------------https://towardsdatascience.com/?source=post_page---byline--896b22542b3e-------------------------------- Sandi Besen

·发表于 Towards Data Science ·5 分钟阅读·2024 年 6 月 18 日

就像人类依赖记忆做出明智的决策和得出合乎逻辑的结论一样,人工智能也依赖其检索相关信息、理解上下文和从过去经验中学习的能力。本文深入探讨了为什么记忆对人工智能至关重要,探索了它在回忆、推理和持续学习中的作用。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0300026eea8f0efe2791300fde5612c2.png

色彩斑斓的大脑与代表记忆的微芯片 来源:DALLE3

记忆在回忆中的作用

有些人认为扩大上下文窗口将提升模型性能,因为这使模型能够摄取更多信息。虽然在某种程度上这是正确的,但我们目前对于语言模型如何优先考虑上下文的理解仍在发展。事实上,研究表明,“当相关信息出现在输入上下文的开头或结尾时,模型性能最高。”[1] 上下文窗口越大,我们越有可能遇到著名的“迷失在中间”问题,即由于重要信息被埋藏在中间,模型无法回忆起特定的事实或文本[2]

为了理解记忆如何影响回忆,考虑人类是如何处理信息的。当我们旅行时,我们会被动地听到很多公告,包括航空公司广告、信用卡优惠、安全简报、行李领取信息等。我们可能没有意识到我们吸收了多少信息,直到我们需要回忆相关内容时。例如,如果一个依赖于检索相关信息来回答问题的语言模型,而不是依赖固有知识,被问到“紧急迫降时我该怎么做?”时,它可能无法回忆出回答这个重要问题所需的相关细节,因为检索了太多的信息。然而,拥有长期记忆的模型可以存储和回忆最关键的信息,从而在适当的上下文中进行更有效的推理。

记忆在推理和持续学习中的作用

记忆提供了重要的上下文,使模型能够理解过去解决问题的方法,识别哪些方法有效,哪些需要改进。它不仅提供了重要的上下文;还使模型能够回忆出先前用于解决问题的方法,识别成功的策略,并找出需要改进的领域。这一改进反过来有助于模型在复杂的多步骤任务中进行有效的推理。如果缺乏足够的推理能力,语言模型将难以理解任务,无法逻辑性地思考目标,解决多步骤问题,或者使用适当的工具。你可以阅读我上一篇文章中关于推理和高级推理技术的重要性的内容,点击这里

以手动在公司数据仓库中查找相关数据为例。那里有成千上万的表格,但由于你理解需要哪些数据,因此可以专注于一个子集。经过数小时的搜索,相关数据被找到了,分布在五个不同的表格中。三个月后,当数据需要更新时,必须重复搜索过程,但你可能记不起曾用过的 5 个源表格来生成这个新报告。手动搜索过程再次重复。如果没有长期记忆,语言模型可能会以相同的方式解决这个问题——凭借蛮力——直到找到相关数据来完成任务。然而,配备了长期记忆的语言模型可以存储初始的搜索计划、每个表格的描述以及基于每个表格的搜索结果所修订的计划。当数据需要更新时,它可以从之前成功的方法开始,从而提高效率和性能。

这种方法使系统能够随着时间的推移不断学习,持续修订任务的最佳方法,积累知识,从而生成更高效、性能更强的自主系统。

评估将长期记忆纳入您的 AI 解决方案的投资

将长期记忆纳入 AI 系统中,可以显著提升其能力,但是否值得为这种能力进行必要的开发投入,需要慎重考虑。

1. 理解任务的性质

  • 复杂性和持续时间:如果您的任务涉及复杂的多步骤过程或需要长期保存信息,长期记忆可以提高效率和准确性。例如,项目管理应用中,任务可能跨越数月,通过 AI 的记忆和从之前的上下文和迭代中获得的适应能力,可以带来益处。

  • 上下文敏感性:依赖于上下文理解的任务,如客户服务互动、营销个性化或医疗诊断,可以利用长期记忆提供更个性化的响应。例如,IT 帮助台助手可以从记住客户是否曾遇到过这个问题以及如何在之前的互动中解决中获益。

2. 评估数据的量和变化性

  • 高数据量:如果您的应用需要定期引用大量数据,长期记忆可以避免重复处理相同的信息,从而节省时间和计算资源。

  • 数据变化性:在数据频繁变化的环境中,长期记忆有助于保持 AI 更新最新信息,从而确保更准确的输出,而无需重新训练。

3. 评估成本效益比

  • 平衡成本与性能收益:实施长期记忆可能需要大量资源,并且随着记忆的积累,需求将不断增长。重要的是权衡数据存储的财务投资与可能的性能提升之间的关系。对于小型企业或资源有限的应用,具备长期记忆的小型语言模型(SLMs)可能提供一个更为平衡的解决方案。

  • 竞争优势:通过提高 AI 应用的效率和效果,长期记忆可以提供显著的竞争优势,使企业能够提供比那些使用传统无记忆功能模型的企业更优质的服务。

4. 解决安全性和合规性问题

  • 数据隐私:长期记忆涉及存储更多数据,这可能引发隐私问题。确保您的系统符合数据保护规定,并且敏感信息遵循最佳安全实践。

本质上……

将长期记忆融入 AI 系统为提升其能力提供了重大机会,通过提高准确性、效率和上下文理解能力。然而,决定是否投资这一能力需要仔细考虑并进行成本效益分析。如果战略性地实施,长期记忆的引入能够为你的 AI 解决方案带来实际的好处。

有问题或者认为某些内容需要进一步澄清吗?请在Linkedin上给我发私信!我总是渴望参与深度思考并对我的工作进行迭代。我的工作并不代表我雇主的观点。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐