hello-agent学习记录
第一章
先介绍了agent的概念、历史。
然后写了一个简易agent的实现:prompt,输入大模型,模型输出(拼接到prompt中),执行模型的输出(拼接到prompt中)。循环5次。需要注意的是,除了用户自己的问题prompt,还定义了一个system_prompt。这个system_prompt中定义了大模型可以使用的工具、回答规范等。
之后介绍了智能体的协作模式,以及workflow和agent的差异
第二章
介绍智能体的发展史,比如符号主义、强化学习、大语言模型训练等,偏概念
第三章
介绍大语言模型的基本原理:建立假设模型、到神经网络、Transformer。
之后介绍了与大语言模型的交互方式,包括提示词工程、文本分词、模型选择。
最后介绍了大语言模型的“缩放法则”与“模型幻觉”。“缩放法则”的大致意思是模型不一定是参数越多越好,在某一参数量级下,有一个最优的训练数据量。以及模型规模达到一定阈值,会涌现出一些全新的能力,比如链式思考、代码生成等。“模型幻觉”是指模型输出一些明显不正确的编造信息。解决方式包括:高质量的数据清洗、探索新的模型架构、推理时引入RAG、采用多步推理验证、引入外部工具等。
第四章
介绍了如何开发一个简单的智能体,以及智能体开发的三种范式:ReAct、Plan-and-Solve、Reflection。本章按照以下步骤介绍:
1、编写实例代码,只执行一次的最简单智能体
2、使用ReAct范式:
让智能体能够按照思考-执行-观察的步骤循环执行。
先根据prompt和tools输出action,决定调用哪一个tool。再执行action,得到observation。将observation放入历史上下文中,跟随下一次执行输入到大模型中。直到智能体认为已经得到最终结果,才结束。
3、使用Plan-and-Solve范式:
先plan:prompt是这一步骤的核心,需要在prompt中要求大模型输出解决问题的计划和步骤,而不是直接要求输出结果
再execute:将prompt、上一步得到的完整计划、当前步骤、以及历史对话(之前步骤的结果)输入大模型中执行,得到最终结果
4、Reflection范式
分为三步:执行 -> 反思 -> 优化。为了实现,需要通过prompt构建两个不同的角色:执行器和评估器。为了迭代,也需要构建一个短期记忆模块。
但本节的实例中,构建了3个角色:初步执行器、评估器、优化器(实际也是执行,执行评估器的反馈)。初步执行器只在最开始执行一次。之后便是评估器和优化器循环迭代。
该范式的结果质量高,但消耗token偏多。
第五章
介绍了三种用于搭建智能体的低代码平台:COZE、Dify、n8n。并手把手指导如何分别在这三个平台上搭建出自己的智能体。
COZE:“每日AI简报”助手
Dify:超级个人助手
n8n:智能邮件助手
这三个平台,COZE门槛最低,适合快速搭建,但不支持MCP;Dify工具丰富、但有一定的门槛;n8n更像一个通用的自动化工作流平台,功能强大,但如果工作流变得复杂,出现问题后定位会困难。
第六章
介绍了四种智能体框架:AutoGen、AgentScope、CAMEL、LangGraph
目前整体看下来这四个框架,个人理解还是有点困难。比如这四个框架究竟各自为了解决什么问题才出现。还需要再思考思考。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)