Barry Zhang (Anthropic) 思想体系总结

← 返回 AI-Insight

内容来源清单

类型	标题	平台	时间
📝 博客	Building Effective AI Agents	Anthropic 官方	2024.12
🎤 演讲	How We Build Effective Agents	AI Engineer Summit	2025.02
🎤 演讲	Don't Build Agents, Build Skills Instead	AI Engineer Code Summit	2025.11
🎥 视频	Tips for building AI agents	Anthropic 官方	2025.02
📰 采访	More AI Agents Isn't the Answer	Business Insider	2025.12

📊 影响力数据

指标	数据
"How We Build Effective Agents" 观看量	404K+
"Don't Build Agents, Build Skills" 观看量	742K+
入选2025年度50个最受关注软件工程演讲	✅
Skills 发布后5周内创建数量	数千个

核心思想框架

Agent 定义与分类

Barry Zhang 与 Erik Schluntz 共同提出了业界最清晰的 Agent 定义框架：

Agentic Systems (智能系统)
├── Workflows (工作流)
│   └── 通过预定义代码路径编排 LLM 和工具
│   └── 特点：可预测、一致性强、适合明确定义的任务
└── Agents (智能体)
    └── LLM 动态指导自己的流程和工具使用
    └── 特点：自主性强、灵活性高、适合开放问题

Augmented LLM (增强型LLM)

这是构建所有 agentic systems 的基础构建块：

增强能力	描述	实现方式
Retrieval	生成搜索查询，获取外部知识	RAG、向量数据库
Tools	选择并调用合适的工具	Function Calling
Memory	决定保留哪些信息	上下文管理、长期记忆

关键洞察

Augmented LLM 填补了"简单 LLM 调用"和"完整 Agent"之间的空白，是 Barry Zhang 框架的核心基础。

Agent 设计三大核心原则

原则一：Don't Build Agents for Everything

不要为所有事情构建 Agent。如果你能轻松画出整个决策树，那就直接构建它，然后优化每个节点。

维度	适合 Agent ✅	适合 Workflow ⚡
任务复杂度	问题空间模糊，难以预测步骤	可以轻松画出完整决策树
任务价值	高价值产出，不限 token 预算	低预算（如每任务 $0.10）
错误成本	低风险、错误易发现和恢复	高风险、错误难以检测
可验证性	结果可通过测试或反馈验证	结果难以客观评估

原则二：Keep It Simple (保持简单)

Agent 的本质定义惊人地简单：Agent = Model + Tools + Loop (环境反馈)

"We have learned the hard way to keep this simple, because any complexity up front is really going to kill iteration speed."

原则三：Think Like Your Agents

将自己置于 Agent 的上下文窗口中。Agent 在每一步推理时，所知道的关于世界的一切都只有 10-20K tokens。

调试技巧

让 Claude 检查 System Prompt：问"这个 prompt 有歧义吗？"
让 Claude 评估工具描述：问"这个工具描述清楚吗？"
分析 Agent 轨迹：把决策历史喂给 Claude 分析

五大工作流模式

模式	核心思想	适用场景
1. Prompt Chaining	将任务分解为顺序步骤，每个 LLM 处理前一个的输出	任务可干净地分解为固定子任务
2. Routing	分类输入并路由到专门处理流程	有明确分类且各类需要不同处理
3. Parallelization	拆分为独立子任务并行执行，或同一任务多次执行取共识	子任务独立、可并行
4. Orchestrator-Workers	中央 LLM 动态分解任务，委派给工作 LLM	子任务不是预定义的
5. Evaluator-Optimizer	一个 LLM 生成，另一个评估并提供反馈循环	有明确评估标准，需迭代精炼

为什么 Coding 是 Agent 的最佳用例

维度	分析
复杂性 ✅	从设计文档到 PR，过程高度模糊和复杂
价值 ✅	优质代码价值极高，值得消耗大量 tokens
可验证性 ✅	通过单元测试、CI/CD 自动验证结果正确性
反馈循环 ✅	测试结果提供明确的环境反馈

"Don't Build Agents, Build Skills Instead" 新范式

核心思想转变

旧范式：为每个领域/用例构建不同的 Agent
新范式：单一通用 Agent + 可扩展的 Skills 库

"We used to think agents in different domains will look very different. The agent underneath is actually more universal than we thought."

Skills 的定义

"Skills are organized collections of files that package composable procedural knowledge for agents."

Skills = Markdown + YAML 元数据 + 可选脚本

Skills 的优势

优势	说明
可复用性	技能可以跨 Agent、跨项目共享
网络效应	技能越多，Agent 能力增长越快
专业化	每个 Skill 可以深度优化
低门槛	非技术人员也能创建 skill
Token 高效	按需加载，节省上下文

实际采用情况

发布 5 周内用户创建了数千个 skills
会计、法律、招聘等非技术领域都有人创建 skills
Fortune 100 公司正在使用 skills "教 Agent 组织最佳实践"

未来展望

"Agents writing skills for other agents" —— 预示着一个自我进化的生态系统。

实践启示

对开发者的建议

起步阶段

建议	具体做法
从简单开始	先用 LLM API 直接调用，验证单点能力
避免过早框架	框架可以快速启动，但先理解底层
小步迭代	先让行为正确，优化放到后期

设计阶段

建议	具体做法
评估是否需要 Agent	使用决策检查清单判断
选择合适模式	从五大工作流模式中选择
投资工具设计	在工具上花的时间可能超过 prompt

对组织的建议

维度	建议
Skills 策略	开始创建组织专属 skills 库
知识沉淀	将最佳实践转化为 skills
共享机制	建立 skills 共享和评价体系

思想演进脉络

2024.12.19

"Building Effective Agents" 博客发布

定义 Agentic Systems、Workflows vs Agents，提出 Augmented LLM 概念

2025.02

AI Engineer Summit 演讲

三大核心原则深化，提出未来三大开放问题

2025.11

"Don't Build Agents, Build Skills Instead"

从"多Agent"到"单Agent+多Skills"的范式转变

💡 了解更多

AI洞察是一个系统化追踪AI行业动态的项目，每日/每周输出调研洞察，帮助你保持对AI行业的全局视野。覆盖大模型、AI Coding、AI应用、AI行业投融资、企业AI转型五大领域。

🏠 访问AI洞察首页