“Agent”一词早在马文·明斯基(Marvin Minsky,《心智社会》《情感机器》)、Russell 和 Norvig 等学者的著作中就出现,但在大模型时代,OpenAI 重新定义了这一概念:
智能体=基于大模型的推理+结合工具触发行为和交互
基于大模型的推理能力,使用工具执行(Action)大模型的规划方案(Planning) ,并观测(Observation)执行的过程,保证任务落地。
基于大模型的推理能力,使用工具执行(Action)大模型的规划方案(Planning) ,并观测(Observation)执行的过程,保证任务落地。
状态(State):对特定时刻的系统的完整描述。
策略(Policy):行为决策的指导原则
价值(Value):对状态或行为的长期收益评估,预期将来得到的奖励之和。
“基于 GPT-3.5 构建的 AI 智能体工作流表现比 GPT-4 更好,这表明通过迭代、反思,AI 模型能够逐步构建更高质量的输出。4 种 AI智能体的设计模式——反思、工具使用、规划和多智能体协作,都有助于推动 AI 发展,并可能提前达到下一代基础模型的效果。”
Tesla 和 OpenAI 的创始科学家之一 Andrej Karpathy
Tesla 和 OpenAI 的创始科学家之一 Andrej Karpathy
Entity(智体)v agent(特工)——代理不打代理
没有(唯一的)真理了,AI 和特工都是不知在代理谁的代理(agent)。