当前生成式AI模型主要用于内容创作和信息过滤。然而,最近对AI智能体(自主完成用户定义目标的参与者)的研究表明,AI若能拥有类似于1990年代互联网的经济通道,可能会解锁前所未有的潜力。
智能体需要代理他们可以控制的资产,因为传统金融系统并非为此设计。这正是加密货币的用武之地:它提供了一个快速结算的数字支付和所有权层,非常适合构建AI智能体。
本文将介绍智能体及其架构的概念,展示研究中如何证明智能体具备超越传统语言模型(LLM)的新属性,并探讨一些基于加密货币的智能体解决方案及其项目。
什么是AI智能体?
AI智能体是由LLM驱动的实体,能够规划和采取行动,以实现目标。智能体架构可能由单个或多个智能体组成,共同解决问题。每个智能体通常都有特定的个性,并可以使用各种工具来完成任务。
与当前人们通过零次提示(输入提示,LLM基于预先存在的知识生成响应)的交互方式不同,智能体架构允许初始化目标,LLM将其分解为子任务,递归地提示自己或其他模型,直到达成目标。
智能体架构类型
-
单智能体架构: 单个语言模型执行所有推理、规划和工具操作,无需其他智能体的反馈机制。人类可以选择向智能体提供反馈。
-
多智能体架构: 涉及两个或更多的智能体,可以使用相同或不同的语言模型和工具。每个智能体通常扮演不同的角色,有以下两种结构:
- 垂直结构:一个智能体充当领导者,其他智能体向其汇报。
- 水平结构:一个大型团队讨论,每个智能体都能看到其他消息,并自愿完成任务或调用工具。
智能体的关键元素
-
配置文件(个性): 智能体的角色定义了其行为和技能。这可以通过手工制作、LLM生成或数据集对齐来创建。例如,提示“你是营养专家。请为我提供一份膳食计划”能提升LLM的输出质量。
-
记忆(Memory): 智能体通过感知环境信息并利用这些信息制定新的计划或行动,使其能够根据经验自我进化。常见的记忆结构包括:
- 统一记忆:类似于短期记忆,所有相关记忆在每次提示中传递给智能体。
- 混合记忆:结合短期和长期记忆,使用矢量数据库等方式来存储和回忆记忆。
-
规划(Planning): 将复杂任务解构为简单的子任务。规划可分为无反馈和带反馈两种:
- 无反馈规划:如思路链(Chain of Thought, CoT),鼓励LLM表达其思维过程。
- 带反馈规划:通过外部反馈不断细化子任务。
-
行为(Action): 行为将智能体的决策转化为具体结果,如完成任务、沟通或环境探索。行为通常来自记忆回忆或计划遵循。
-
能力获取(Skill Acquisition): 智能体可以通过微调或无需微调的提示工程来获得特定任务的能力。
智能体的应用示例
- 生成式智能体:在虚拟沙箱中模拟人类行为,如a16z的AI Town,智能体自动协调并参与情人节派对。
- Voyager:Minecraft中的智能体,可以自主探索世界并学习新技能,无需人工干预。
- HuggingGPT:使用ChatGPT进行任务规划,选择和执行子任务,适用于语言、视觉和语音任务。
加密领域的智能体示例
- FrenRug(Ritualnet):基于GPT-4的土耳其地毯推销员游戏。智能体在链上通过投票决定是否购买提议的Key。
- Gnosis上的预测市场智能体:使用autonolas的AI机器人,通过支付提问来调用AI服务,执行任务并返回答案。
- ianDAOs的GPT<>Safe演示:GPT自主管理Base链上的Safe多重签名钱包,与用户互动并根据建议分配资金。
值得关注的智能体项目
- AIWay Finder:去中心化知识图谱,智能体可导航区块链生态系统,用户因识别路径而获得奖励。
- Morpheus:代表用户执行智能合约的个人通用AI网络,应用于web3钱包和数据解析等。
- Naptha:智能体编排协议,支持异步消息传递和跨节点任务的工作流引擎。
总结
自主智能体正逐步成为区块链交互的重要部分,它们为下一代加密用户提供了无尽的可能性。随着LLM的成本下降和智能体创建的便利性提升,AI智能体将可能主宰未来的链上交互。