跳到主内容
深度调研 · 2026-05-10

Anthropic 金融 Agent:一套新组织方式

10个金融Agent模板不是"又一个AI功能",而是一套可复制的组织方式:Skills × Connectors × Subagents。配合Microsoft 365的工作流嵌入、16+金融数据生态与Moody's MCP app,以及"users stay in the loop"的治理哲学,Anthropic在金融行业交付的不是发动机,而是整车。

$30B+
2026年收入(预估)
10
Agent模板
16+
数据Connector
64.37%
Finance Benchmark
1

研究概述:同一天发生的三件事,不是巧合

如果只把它当作"又一组prompt",你会错过核心信号。这不是Anthropic第一次做行业模板——但这次不同的是:他们把Agent从聊天工具推向可部署的组织单元。每个模板不是10个prompt,而是reference architecture——Skills+Connectors+Subagents的完整打包,金融公司可以把风控政策、审批流程直接注入。

同日还宣布了合资公司的成立——与Blackstone、Hellman & Friedman、Goldman Sachs一起,把Anthropic工程师嵌入服务团队。Dario Amodei现场宣布2026年预计收入超30亿美元(去年9亿→30亿,3倍增长)。Jamie Dimon亲自站台,说JPMorgan用Claude Code 20分钟完成了dashboard。这不是一场发布会,是一份Agent商业化路线图

2026年5月,Anthropic在金融服务领域做了三件看似是功能更新的事:发布10个金融Agent模板(reference architecture)、把Claude深度嵌入Microsoft 365(Excel/PPT/Word/Outlook)、扩展金融数据生态(16+ Connectors + Moody's MCP app)。同日还宣布了第四件事:和Blackstone、Hellman & Friedman、Goldman Sachs合资成立企业AI服务公司。

Dario Amodei现场宣布2026年预计收入超30亿美元(去年9亿→30亿,3倍增长)。Jamie Dimon亲自站台,说JPMorgan用Claude Code 20分钟完成了dashboard。

10 Templates Reference Architecture Microsoft 365 Workflow Embed Data Ecosystem Connectors + MCP
关键判断

Agent商业化的关键不在模型,而在"知识+数据+治理"的打包方式。Anthropic把金融行业的知识(skills)、受控数据接入(connectors)、可审计的协作分工(subagents)组合成可部署单元——这才是结构性信号。

2

Skills+Connectors+Subagents:不是AI工具,是组织方式

10个Agent模板的核心架构是三层——Anthropic称之为reference architecture

功能类比自进化体系对应
Skills领域知识+指令(建模规范、合规流程、风控政策可注入)员工的岗位手册技能定义文件
Connectors受控数据接入(16+金融数据源+Moody's MCP app)员工的系统权限工具链/数据接入层
Subagents主Agent调子模型(可比公司筛选、方法论校验)员工请教专家人格Agent层级委托

Skill file有两种写法:简单技能用Markdown——定义触发条件和工作流步骤,类似岗位手册;高级技能用可执行脚本——能自动运行复杂流程。金融公司可以把风控政策、建模规范、合规审批流程直接写进skill file——Agent就变成"按你的规矩干活的新员工"。

Reddit/ClaudeCode社区指出:skill files定义触发条件和工作流步骤,connectors接入数据,subagents处理专门子任务——三因子模型在任何行业都能复用。金融只是第一个,法律、医疗、保险的模板会接踵而至。Anthropic自己也明确表示模板是domain-agnostic的。

金融公司可以把风控政策、审批流程塞进去——Agent变成"按你的规矩干活的新员工"。不是通用chatbot配了个金融壳,是整个行业的知识、数据、流程被打包成了可部署的单元。

Reddit/ClaudeCode社区指出:这套架构是domain-agnostic的。金融只是第一个场景,法律、医疗、保险的模板会直接复用同一个三因子模型。

Skills · 岗位手册 Connectors · 系统权限 16+ 数据源 Subagents · 请教专家
和自进化体系的对照

Skills=技能定义文件技能定义文件,Connectors=工具链/数据接入层,Subagents=人格Agent层级委托——同一思想的不同实现。Anthropic做成商业产品,自进化体系做自进化底层架构。架构思路验证了,但执行速度要快。

3

Skill file格式详解:Anthropic vs 自进化体系技能定义文件

Anthropic的Skill file是三层架构里最关键的一层——它决定了Agent"知道什么"和"怎么干"

维度Anthropic Skill file自进化体系 技能定义文件
格式Markdown(简单技能)/ 可执行脚本(高级技能)Markdown(统一格式)
触发机制定义触发条件和工作流步骤description触发词 + 按步骤执行
内容范围建模规范、风控政策、合规审批流程描述+触发词+执行流程+输出规范+经验沉淀
注入方式金融公司把自己的规矩塞进去任务场景适配,自进化迭代
进化机制人工维护更新自进化引擎(learn-from-mistakes + daily-reflection)
分发方式GitHub marketplace (anthropics/financial-services)本地文件 + AI洞察 skill-creator
对照核心洞察

两者都是"领域知识+指令"的打包,可注入行业规则。Anthropic用静态skill file(人工维护),自进化体系用动态技能定义文件(自进化引擎驱动)。Anthropic验证了skill file这条路是对的——但进化机制是差异化竞争力。

4

Agent落地全链路:瓶颈不在模型,在全链路

Anthropic不只是在卖模型,他们做的是四层全链路

做了什么金融行业要求
数据层16+ connector + Moody's MCP app实时接入市场数据,不能离线
治理层per-tool权限 + credential vaults + 全量audit log每一步可审计,合规
交付层Excel/PPT/Word/Outlook直接产出专业文件输出,不是chatbot文本
部署层Cowork插件(人机)+ Managed Agents(自动排程)两种模式满足不同场景
数据层16+ connectors 治理层audit log+权限 交付层Excel/PPT/Word 部署2模式
金融不是AI的"容易市场"

数据敏感、错误代价高、每一步都需要审计追踪。Agent商业化的瓶颈不在模型能力,在"能不能安全接入企业数据和流程"。这也是为什么Anthropic做了合资公司。

5

64.37% Benchmark:既是成绩也是警告

Vals AI Finance Agent benchmark分数:

64.37%
Claude Opus 4.7 领先
59.96%
GPT-5.5
59.72%
Gemini 3.1 Pro

细分任务表现差异巨大:

任务类型准确率说明
结构化任务(分类+日记账)92%接近可用
财务报告62%需人审
月结关账50%离自主交付很远

金融AI成熟度分级解读

层级定义当前状态
L1 · AI CodingAI做代码级辅助已成熟
L2 · AI 辅助开发AI做初稿,人审+修改+批准金融行业当前(64%可靠度)
L3 · AI 协同开发AI自主交付部分需求尚远(50%关账率不够)
L4 · AI 自主开发AI全自主完成交付遥不可及
关键判断

Agent适合做初稿和加速,不适合做最终交付。35.63%的失败率会让任何人类分析师被开除。Anthropic自己的立场:"users stay in the loop"。

值得注意的是,Anthropic自己对此非常坦诚——不是夸耀64%领先,而是反复强调"users stay in the loop"。这是一种产品设计哲学:Agent是加速器不是替代品。金融行业的信任需要逐步建立,不是一蹴而就。

The Register指出:35.63%的失败率会让任何人类分析师被开除。但Anthropic的立场是——Agent适合做初稿和加速,不适合做最终交付。这个坦诚本身就是差异化信号:比承诺"全自动"的供应商更值得信赖。

6

合资公司信号:Blackstone+Goldman不只是渠道合作

合资公司不是简单的渠道合作,而是一种新的商业形态

✓ 合资公司模式
Anthropic工程师嵌入服务团队
PE portfolio公司是天然种子客户
AI公司→行业数字化转型合伙人
实施瓶颈有人解决
✕ 传统卖API模式
客户自己实施落地
实施瓶颈无人解决
AI公司只是技术供应商
无法解决行业特定问题

"我们打算建设一家规模化、世界级的企业AI服务公司。部署Anthropic的技术到Blackstone的portfolio和更广泛的业务中。" — Jon Gray,Blackstone总裁兼COO [原文]

IPO时间线:Bloomberg报道Anthropic考虑最早10月IPO,估值可能超过$900B。从$9B收入到$30B,再到$900B估值——这是AI公司从技术供应商到行业合伙人的资本逻辑。

结构性判断

合资模式是不可逆的,不是周期性。AI Agent落地需要行业知识+数据接入+合规治理——这三样只有行业内的公司才有。

合资公司模式与IPO的联动:合资公司不仅是渠道创新,也是IPO估值逻辑的铺垫——从"AI模型公司"到"行业数字化转型合伙人",估值基础从技术溢价变成生态溢价。Bloomberg报道估值$900B+,远超纯模型公司的估值天花板。

合资/生态绑定是唯一路径。

7

10个Agent模板清单:前台5个 + 后台5个

类别Agent模板主要用途状态
前台Pitch builder建立目标名单、运行可比分析、起草pitchbook生产级
前台Meeting preparer组装客户/对手方简报,协助会前准备生产级
前台Earnings reviewer读财报逐字稿和申报文件,更新模型,标记关键变化生产级
前台Model builder从申报资料/数据源/分析师输入建立财务模型生产级
前台Market researcher追踪行业/发行人动态,综合新闻/文件/券商研究生产级
后台Valuation reviewer按可比公司、方法论和公司标准检查估值需人审
后台GL reconciler对账总账账户并执行NAV计算部分可靠
后台Month-end closer执行关账清单、准备分录、产出关账报告50%准确率
后台Statement auditor检查财务报表一致性、完整性和审计准备度需人审
后台KYC screener组装实体档案、审查源文件、打包合规升级案件合规刚需

两种部署模式

Cowork/Code插件模式

Agent与分析师并肩工作,使用桌面已有软件。给Pitch Agent一个目标名单,就能得到Excel可比模型、PowerPoint pitchbook草稿、Outlook覆盖信——一次任务三份产出。

人机协作
Managed Agent模式

同一个模板在Claude Platform上自主运行。Cookbook提供长会话(数小时)、per-tool权限、managed credential vaults、全量audit log。适合夜间排程和整本书交易处理。

自动排程
核心原则

Users stay in the loop——审核、迭代、批准后再提交。Agent不做最终决定。这不是技术限制,是产品设计哲学。

8

Microsoft 365深度整合:四个场景,一个上下文

核心创新不是"Claude能在Excel/PPT/Word里干活",是上下文自动延续。分析师在Excel里建的模型,不需要到PPT里重新解释——Claude自动理解上下文。

Excel建模+审计 PowerPoint自动更新 Word模板合规 OutlookComing
📊 Excel — 金融建模引擎

从申报资料和数据源自动建立财务模型,审计跨linked workbook的公式,运行敏感性分析。分析师在Excel里直接与Claude交互——不切换窗口。

📈 PowerPoint — 自动Pitchbook

起草deck,当底层数据变化时自动更新图表。Excel里建的模型,到PPT自动转成可视化——不需要手动复制粘贴。

📝 Word — 信用备忘合规编辑

按公司自有模板编辑信用备忘。Claude理解公司格式要求和审批流程,自动填入数据、检查合规性。

📬 Outlook — 首席参谋(Beta)

分拣邮件、安排会议、用你的语气草拟回复。Dispatch功能允许通过文字/语音从任何地方分配任务给Claude。

Dispatch的关键意义

分析师离开办公桌后Claude继续处理本地文件,回来时已完成待审核。这是"AI员工"概念的落地——不是需要你盯着才干活。

9

数据生态:16+ Connector详解 + Moody's MCP App

AI Agent are only as good as the data they can access. Claude connects to dozens of market data, research platforms, and financial companies' internal systems—all under governed access controls.

Connector vs MCP App的区别

✓ MCP App(如Moody's)
不只读数据,嵌入交互式工具
6亿+ 公开+非公开企业信用评级
分析师在Claude里直接操作Moody's界面
合规/信用分析/业务拓展场景
✕ Connector(只读)
只给Claude governed实时数据访问
类似员工获得系统权限,只能读数据
无交互式操作能力
研究/建模场景

新增8个Connector详解

Connector领域数据覆盖核心场景
Dun & Bradstreet企业身份验证D-U-N-S® Number全球标准KYC screener合规刚需
Fiscal AI实时基本面公开股票基本面+盈利预测Model builder实时更新
Financial Modeling Prep全品类实时数据股票/ETF/加密/外汇/商品跨市场研究
Guidepoint一级研究10万+合规专家访谈逐字稿Earnings reviewer交叉验证
IBISWorld行业级分析数千行业收入/风险/成本结构Pitch builder行业概览
SS&C IntralinksM&A数据室DealCenter AI数据室尽职调查+交易追踪
Third Bridge专家访谈一手专家访谈预约Market researcher实时洞察
Verisk保险数据财产/意外/特种保险Statement auditor交叉验证
Moody's MCP App是信号

数据供应商正在从"卖数据"变成"卖Agent生态嵌入"。FactSet/S&P/PitchBook未来都可能出MCP app——数据行业的商业模式正在被重写。

10

客户证言分析:谁在用,为什么选Claude

FIS — 金融基础设施

"当我们开始建AI agents,需要一个可信赖的provider。Anthropic是明确的选择。一起建AML调查Agent——从数天压缩到数分钟。FIS客户不需要自建基础设施。"

治理优先
Carlyle — PE巨头

"Carlyle选择Claude作为AI技术栈关键部分——强编码能力、agent推理、持续进步。从投资到运营到portfolio管理,交付价值。"

全链覆盖
Walleye Capital — 100%全员

"400人hedge fund里100%员工用Claude Code。反映了AI-first心态——每个人不断重新思考工作方式,总是在问'AI怎么帮我做这件事'。"

全员采用
Morningstar + PitchBook

"投资者需要可信赖的AI——信任始于数据。把几十年的独立、分析师支撑的智能带给Claude。用户不仅得到更快答案,而是更好答案。"

数据+AI融合
FactSet — 数据平台化

"客户越来越想在AI辅助工作流里直接使用FactSet数据。与Anthropic合作把Claude带入托管编程环境——在已有工具里推理我们的基础市场数据。"

平台化
证言揭示了三种选择模式

治理优先(FIS):金融基础设施选确定性+审计。全链覆盖(Carlyle/Walleye):从前台到后台,一个AI覆盖全部。数据+AI融合(Morningstar/FactSet):数据供应商把AI嵌入自己的生态——会改变数据行业的商业模式。

11

本质穿透:四层递进(视角)

L2 规律层:Agent商业化 = 行业模板 × 数据生态 × 治理保障。不是更强的chatbot,是把行业的知识×数据×流程打包成可部署的单元。

L3 映射层

通用模型是发动机——强大但需要自己组装底盘、内饰、驾照。Copilot是改装套件——增强现有工具,但不改变本质。Anthropic金融Agent模板是整车——发动机+底盘+内饰+驾照一起交付,客户只需定制化(填自己的风控政策和建模规范)。

✓ Anthropic金融Agent = 整车
发动机+底盘+内饰+驾照一起交付
客户只需定制化(填自己的规矩)
行业知识×数据×流程全打包
合资公司模式解决实施瓶颈
✕ 通用AI模型 = 发动机
强大但需要自己组装
Copilot只是改装套件
客户自己解决数据接入+合规
实施瓶颈无人解决

L4 演变层

时间变化信号
短期(3-6月)法律、医疗、保险垂直模板出现模板化=规模化路径
中期(6-18月)数据供应商角色重新定义Moody's MCP app=信号
长期(18-36月)合资模式扩散AI公司→行业数字化转型合伙人
3-6m 垂直模板 6-18m 数据生态重构 18-36m 合资模式扩散
L5 · 结构性判断:不可逆,不是周期性

AI Agent落地需要行业知识+数据接入+合规治理——这三样只有行业内的公司才有。合资/生态绑定是唯一路径

12

行动建议:对AI生产力实践

优先级建议说明
P0Agent平台架构明确Skills+Connectors+Subagents三层与业界主流对齐,降低业务线理解成本
P1设计研发效能10个垂直Agent模板需求拆解/代码审查/测试生成/部署检查/效能度量——对标Anthropic金融10模板
P1Connectors层接入数据平台+数据分析平台+BI平台数据接入是Agent落地前提,优先3个核心平台
P2研究合资公司模式AI生产力战役需业务线深度参与,纯技术驱动不够
P2AiDD/QECon引用此案例增强业界影响力

研发效能10模板草案(对标Anthropic金融10模板):

类别模板名核心场景
前台需求拆解AgentPRD→子任务分解+依赖识别+优先级排序
前台代码审查AgentPR→自动审查+风格/安全/性能标记
前台测试生成Agent需求/代码→单元/集成/边界测试用例
前台部署检查AgentCI/CD→发布前检查+回滚预案
前台效能度量Agent度量数据→异常检测+趋势分析+改进建议
后台依赖升级Agent自动检测+安全评估+升级方案
后台文档补全Agent代码→README/API doc/变更日志
后台性能优化Agentprofiling→瓶颈识别+优化建议
后台合规检查Agent许可证/敏感词/安全漏洞扫描
后台知识沉淀Agent经验→技能定义文件更新+最佳实践归档
反过来的问题

当Anthropic把金融做成了Agent样板间,我们能不能把研发效能做成下一个?金融的数据生态是FactSet+S&P,研发效能的数据生态是Git+CI/CD+Jira+数据平台。

一个反过来的问题:当Anthropic把金融做成了Agent样板间,我们能不能把研发效能做成下一个?金融的数据生态是FactSet+S&P,研发效能的数据生态是Git+CI/CD+Jira+数据平台。数据接入层的壁垒,正好是Agent平台的机会。

Connectors层接入数据平台(数据平台)+数据分析平台(数据分析平台)+BI平台(BI平台)——数据接入是Agent落地前提,优先3个核心平台。这三个平台的接入壁垒恰恰是某公司研发效能的护城河——外部AI公司没有这些内部数据源。

+

技术词汇表

术语定义金融场景
Skill file领域知识+指令定义文件。Markdown写触发条件和工作流步骤,高级可执行脚本。风控政策、建模规范、合规审批流程注入
Connector受控数据接入。给Agent governed访问外部数据源的能力。接入FactSet/S&P/Morningstar等16+金融数据源
Subagent主Agent调用的子模型,处理专门子任务。Pitch builder调subagent做comps筛选
MCP AppModel Context Protocol应用。不只读数据,嵌入provider的交互式工具。Moody's MCP app在Claude里直接操作评级界面
Managed AgentClaude Platform上自主运行的Agent。长会话+自动排程+credential vaults+audit log。Month-end closer Agent夜间自主执行关账
Cowork pluginClaude Cowork/Code里与分析师并肩工作的Agent插件模式。Pitch builder在分析师桌面Excel/PPT里工作
Credential vault受控凭证管理。Agent不直接持有密码,通过vault安全访问。Agent访问FactSet需凭证,vault代管
Audit log全量操作日志。合规和工程团队可检查每个tool call和决策。金融监管要求每步可追溯
Per-tool permission每个工具独立权限控制。KYC screener可读D&B但不可修改CRM
DispatchClaude Cowork功能,文字/语音分配任务。离开桌面后Claude继续工作。分析师通勤时语音分配Earnings review任务
Reference architecture模板架构定义。Skills+Connectors+Subagents的完整打包。10个金融Agent模板都是reference architecture
Comps model可比公司分析模型。找相似公司做估值对比。Pitch builder Agent自动建comps table
NAV calculation净资产值计算。对账总账后确认基金净值。GL reconciler Agent自动算NAV
KYC escalationKYC合规升级案件。Agent审查后标记需要人工审核的实体。KYC screener打包合规升级案件
Close checklist月结关账清单。检查分录、调整、确认。Month-end closer Agent执行关账清单
+

竞争格局:Anthropic vs OpenAI vs Google

维度AnthropicOpenAIGoogle
产品形态整车:行业模板×数据×治理打包发动机+改装件:GPT+Copilot生态平台+自研:Gemini+内部整合
数据生态16+ connector + MCP appCopilot生态(Microsoft数据)Google搜索+内部数据
部署模式Cowork插件 + Managed AgentAPI + Copilot + ChatGPT workspaceVertex AI + Workspace整合
治理能力per-tool权限 + credential vaults + audit log(最完整)ChatGPT Team权限 + API rate limitsVertex IAM + 数据驻留选项
行业覆盖金融先行,法律/医疗/保险待跟进通用(无行业垂直模板)广告/搜索先行,其他弱
商业路径合资公司(Blackstone+Goldman)渠道合作(Microsoft)内部自研+外部API
BenchmarkClaude 64.37%(第一)GPT-5.5 59.96%Gemini 3.1 Pro 59.72%
关键差异

Anthropic的差异化不是"模型更强"(只领先5个百分点),而是整车交付+治理完整+合资绑定。模型差距是量变,组织方式是质变。