“Agent”一词早在马文·明斯基(Marvin Minsky,《心智社会》《情感机器》)、Russell 和 Norvig 等学者的著作中就出现,但在大模型时代,OpenAI 重新定义了这一概念:

智能体=基于大模型的推理+结合工具触发行为和交互

基于大模型的推理能力,使用工具执行(Action)大模型的规划方案(Planning) ,并观测(Observation)执行的过程,保证任务落地。

基于大模型的推理能力,使用工具执行(Action)大模型的规划方案(Planning) ,并观测(Observation)执行的过程,保证任务落地。

状态(State):对特定时刻的系统的完整描述。

策略(Policy):行为决策的指导原则

价值(Value):对状态或行为的长期收益评估,预期将来得到的奖励之和。

吴恩达@AI Ascent 2024大会

“基于 GPT-3.5 构建的 AI 智能体工作流表现比 GPT-4 更好,这表明通过迭代、反思,AI 模型能够逐步构建更高质量的输出。4 种 AI智能体的设计模式——反思、工具使用、规划和多智能体协作,都有助于推动 AI 发展,并可能提前达到下一代基础模型的效果。”

杨立昆(Yann LeCun,Meta AI Research 首席 AI 科学家、纽约大学 Courant 数学科学研究所教授)演讲《从机器学习到自主智能》(From Machine Learning to Autonomous Intelligence)@慕尼黑大学

Tesla 和 OpenAI 的创始科学家之一 Andrej Karpathy

Tesla 和 OpenAI 的创始科学家之一 Andrej Karpathy

SAMIR CHOPRA and LAURENCE F. WHITE, A LEGAL THEORY FOR AUTONOMOUS ARTIFICIAL AGENTS

《碟 7》

Entity(智体)v agent(特工)——代理不打代理

没有(唯一的)真理了,AI 和特工都是不知在代理谁的代理(agent)。