“Agent”一词早在马文·明斯基（Marvin Minsky，《心智社会》《情感机器》）、Russell 和 Norvig 等学者的著作中就出现，但在大模型时代，OpenAI 重新定义了这一概念：

智能体=基于大模型的推理+结合工具触发行为和交互

状态（State）：对特定时刻的系统的完整描述。

策略（Policy）：行为决策的指导原则

价值（Value）：对状态或行为的长期收益评估，预期将来得到的奖励之和。

吴恩达@AI Ascent 2024大会

“基于 GPT-3.5 构建的 AI 智能体工作流表现比 GPT-4 更好，这表明通过迭代、反思，AI 模型能够逐步构建更高质量的输出。4 种 AI智能体的设计模式——反思、工具使用、规划和多智能体协作，都有助于推动 AI 发展，并可能提前达到下一代基础模型的效果。”

杨立昆（Yann LeCun，Meta AI Research 首席 AI 科学家、纽约大学 Courant 数学科学研究所教授）演讲《从机器学习到自主智能》（From Machine Learning to Autonomous Intelligence）@慕尼黑大学

Entity（智体）v agent（特工）——代理不打代理

没有（唯一的）真理了，AI 和特工都是不知在代理谁的代理（agent）。