Anthropic 金融 Agent：一套新组织方式

$30B+

2026年收入（预估）

Agent模板

16+

数据Connector

64.37%

Finance Benchmark

研究概述：同一天发生的三件事，不是巧合

如果只把它当作"又一组prompt"，你会错过核心信号。这不是Anthropic第一次做行业模板——但这次不同的是：他们把Agent从聊天工具推向可部署的组织单元。每个模板不是10个prompt，而是reference architecture——Skills+Connectors+Subagents的完整打包，金融公司可以把风控政策、审批流程直接注入。

同日还宣布了合资公司的成立——与Blackstone、Hellman & Friedman、Goldman Sachs一起，把Anthropic工程师嵌入服务团队。Dario Amodei现场宣布2026年预计收入超30亿美元（去年9亿→30亿，3倍增长）。Jamie Dimon亲自站台，说JPMorgan用Claude Code 20分钟完成了dashboard。这不是一场发布会，是一份Agent商业化路线图。

2026年5月，Anthropic在金融服务领域做了三件看似是功能更新的事：发布10个金融Agent模板（reference architecture）、把Claude深度嵌入Microsoft 365（Excel/PPT/Word/Outlook）、扩展金融数据生态（16+ Connectors + Moody's MCP app）。同日还宣布了第四件事：和Blackstone、Hellman & Friedman、Goldman Sachs合资成立企业AI服务公司。

Dario Amodei现场宣布2026年预计收入超30亿美元（去年9亿→30亿，3倍增长）。Jamie Dimon亲自站台，说JPMorgan用Claude Code 20分钟完成了dashboard。

关键判断

Agent商业化的关键不在模型，而在"知识+数据+治理"的打包方式。Anthropic把金融行业的知识（skills）、受控数据接入（connectors）、可审计的协作分工（subagents）组合成可部署单元——这才是结构性信号。

来源：Anthropic官方：Agents for financial services

Skills+Connectors+Subagents：不是AI工具，是组织方式

10个Agent模板的核心架构是三层——Anthropic称之为reference architecture：

层	功能	类比	自进化体系对应
Skills	领域知识+指令（建模规范、合规流程、风控政策可注入）	员工的岗位手册	技能定义文件
Connectors	受控数据接入（16+金融数据源+Moody's MCP app）	员工的系统权限	工具链/数据接入层
Subagents	主Agent调子模型（可比公司筛选、方法论校验）	员工请教专家	人格Agent层级委托

Skill file有两种写法：简单技能用Markdown——定义触发条件和工作流步骤，类似岗位手册；高级技能用可执行脚本——能自动运行复杂流程。金融公司可以把风控政策、建模规范、合规审批流程直接写进skill file——Agent就变成"按你的规矩干活的新员工"。

Reddit/ClaudeCode社区指出：skill files定义触发条件和工作流步骤，connectors接入数据，subagents处理专门子任务——三因子模型在任何行业都能复用。金融只是第一个，法律、医疗、保险的模板会接踵而至。Anthropic自己也明确表示模板是domain-agnostic的。

金融公司可以把风控政策、审批流程塞进去——Agent变成"按你的规矩干活的新员工"。不是通用chatbot配了个金融壳，是整个行业的知识、数据、流程被打包成了可部署的单元。

Reddit/ClaudeCode社区指出：这套架构是domain-agnostic的。金融只是第一个场景，法律、医疗、保险的模板会直接复用同一个三因子模型。

和自进化体系的对照

Skills=技能定义文件技能定义文件，Connectors=工具链/数据接入层，Subagents=人格Agent层级委托——同一思想的不同实现。Anthropic做成商业产品，自进化体系做自进化底层架构。架构思路验证了，但执行速度要快。

Skill file格式详解：Anthropic vs 自进化体系技能定义文件

Anthropic的Skill file是三层架构里最关键的一层——它决定了Agent"知道什么"和"怎么干"。

维度	Anthropic Skill file	自进化体系技能定义文件
格式	Markdown（简单技能）/ 可执行脚本（高级技能）	Markdown（统一格式）
触发机制	定义触发条件和工作流步骤	description触发词 + 按步骤执行
内容范围	建模规范、风控政策、合规审批流程	描述+触发词+执行流程+输出规范+经验沉淀
注入方式	金融公司把自己的规矩塞进去	任务场景适配，自进化迭代
进化机制	人工维护更新	自进化引擎（learn-from-mistakes + daily-reflection）
分发方式	GitHub marketplace (anthropics/financial-services)	本地文件 + AI洞察 skill-creator

对照核心洞察

两者都是"领域知识+指令"的打包，可注入行业规则。Anthropic用静态skill file（人工维护），自进化体系用动态技能定义文件（自进化引擎驱动）。Anthropic验证了skill file这条路是对的——但进化机制是差异化竞争力。

Agent落地全链路：瓶颈不在模型，在全链路

Anthropic不只是在卖模型，他们做的是四层全链路：

层	做了什么	金融行业要求
数据层	16+ connector + Moody's MCP app	实时接入市场数据，不能离线
治理层	per-tool权限 + credential vaults + 全量audit log	每一步可审计，合规
交付层	Excel/PPT/Word/Outlook直接产出	专业文件输出，不是chatbot文本
部署层	Cowork插件（人机）+ Managed Agents（自动排程）	两种模式满足不同场景

金融不是AI的"容易市场"

数据敏感、错误代价高、每一步都需要审计追踪。Agent商业化的瓶颈不在模型能力，在"能不能安全接入企业数据和流程"。这也是为什么Anthropic做了合资公司。

64.37% Benchmark：既是成绩也是警告

Vals AI Finance Agent benchmark分数：

64.37%

Claude Opus 4.7 领先

59.96%

GPT-5.5

59.72%

Gemini 3.1 Pro

细分任务表现差异巨大：

任务类型	准确率	说明
结构化任务（分类+日记账）	92%	接近可用
财务报告	62%	需人审
月结关账	50%	离自主交付很远

金融AI成熟度分级解读：

层级	定义	当前状态
L1 · AI Coding	AI做代码级辅助	已成熟
L2 · AI 辅助开发	AI做初稿，人审+修改+批准	金融行业当前（64%可靠度）
L3 · AI 协同开发	AI自主交付部分需求	尚远（50%关账率不够）
L4 · AI 自主开发	AI全自主完成交付	遥不可及

关键判断

Agent适合做初稿和加速，不适合做最终交付。35.63%的失败率会让任何人类分析师被开除。Anthropic自己的立场："users stay in the loop"。

值得注意的是，Anthropic自己对此非常坦诚——不是夸耀64%领先，而是反复强调"users stay in the loop"。这是一种产品设计哲学：Agent是加速器不是替代品。金融行业的信任需要逐步建立，不是一蹴而就。

The Register指出：35.63%的失败率会让任何人类分析师被开除。但Anthropic的立场是——Agent适合做初稿和加速，不适合做最终交付。这个坦诚本身就是差异化信号：比承诺"全自动"的供应商更值得信赖。

来源：Vals AI Finance Agent Benchmark · The Register评论

合资公司信号：Blackstone+Goldman不只是渠道合作

合资公司不是简单的渠道合作，而是一种新的商业形态：

✓ 合资公司模式

Anthropic工程师嵌入服务团队

PE portfolio公司是天然种子客户

AI公司→行业数字化转型合伙人

实施瓶颈有人解决

✕ 传统卖API模式

客户自己实施落地

实施瓶颈无人解决

AI公司只是技术供应商

无法解决行业特定问题

"我们打算建设一家规模化、世界级的企业AI服务公司。部署Anthropic的技术到Blackstone的portfolio和更广泛的业务中。" — Jon Gray，Blackstone总裁兼COO [原文]

IPO时间线：Bloomberg报道Anthropic考虑最早10月IPO，估值可能超过$900B。从$9B收入到$30B，再到$900B估值——这是AI公司从技术供应商到行业合伙人的资本逻辑。

结构性判断

合资模式是不可逆的，不是周期性。AI Agent落地需要行业知识+数据接入+合规治理——这三样只有行业内的公司才有。

合资公司模式与IPO的联动：合资公司不仅是渠道创新，也是IPO估值逻辑的铺垫——从"AI模型公司"到"行业数字化转型合伙人"，估值基础从技术溢价变成生态溢价。Bloomberg报道估值$900B+，远超纯模型公司的估值天花板。

合资/生态绑定是唯一路径。

10个Agent模板清单：前台5个 + 后台5个

类别	Agent模板	主要用途	状态
前台	Pitch builder	建立目标名单、运行可比分析、起草pitchbook	生产级
前台	Meeting preparer	组装客户/对手方简报，协助会前准备	生产级
前台	Earnings reviewer	读财报逐字稿和申报文件，更新模型，标记关键变化	生产级
前台	Model builder	从申报资料/数据源/分析师输入建立财务模型	生产级
前台	Market researcher	追踪行业/发行人动态，综合新闻/文件/券商研究	生产级
后台	Valuation reviewer	按可比公司、方法论和公司标准检查估值	需人审
后台	GL reconciler	对账总账账户并执行NAV计算	部分可靠
后台	Month-end closer	执行关账清单、准备分录、产出关账报告	50%准确率
后台	Statement auditor	检查财务报表一致性、完整性和审计准备度	需人审
后台	KYC screener	组装实体档案、审查源文件、打包合规升级案件	合规刚需

两种部署模式：

Cowork/Code插件模式

Agent与分析师并肩工作，使用桌面已有软件。给Pitch Agent一个目标名单，就能得到Excel可比模型、PowerPoint pitchbook草稿、Outlook覆盖信——一次任务三份产出。

人机协作

Managed Agent模式

同一个模板在Claude Platform上自主运行。Cookbook提供长会话（数小时）、per-tool权限、managed credential vaults、全量audit log。适合夜间排程和整本书交易处理。

自动排程

核心原则

Users stay in the loop——审核、迭代、批准后再提交。Agent不做最终决定。这不是技术限制，是产品设计哲学。

Microsoft 365深度整合：四个场景，一个上下文

核心创新不是"Claude能在Excel/PPT/Word里干活"，是上下文自动延续。分析师在Excel里建的模型，不需要到PPT里重新解释——Claude自动理解上下文。

📊 Excel — 金融建模引擎

从申报资料和数据源自动建立财务模型，审计跨linked workbook的公式，运行敏感性分析。分析师在Excel里直接与Claude交互——不切换窗口。

📈 PowerPoint — 自动Pitchbook

起草deck，当底层数据变化时自动更新图表。Excel里建的模型，到PPT自动转成可视化——不需要手动复制粘贴。

📝 Word — 信用备忘合规编辑

按公司自有模板编辑信用备忘。Claude理解公司格式要求和审批流程，自动填入数据、检查合规性。

📬 Outlook — 首席参谋（Beta）

分拣邮件、安排会议、用你的语气草拟回复。Dispatch功能允许通过文字/语音从任何地方分配任务给Claude。

Dispatch的关键意义

分析师离开办公桌后Claude继续处理本地文件，回来时已完成待审核。这是"AI员工"概念的落地——不是需要你盯着才干活。

数据生态：16+ Connector详解 + Moody's MCP App

AI Agent are only as good as the data they can access. Claude connects to dozens of market data, research platforms, and financial companies' internal systems—all under governed access controls.

Connector vs MCP App的区别：

✓ MCP App（如Moody's）

不只读数据，嵌入交互式工具

6亿+ 公开+非公开企业信用评级

分析师在Claude里直接操作Moody's界面

合规/信用分析/业务拓展场景

✕ Connector（只读）

只给Claude governed实时数据访问

类似员工获得系统权限，只能读数据

无交互式操作能力

研究/建模场景

新增8个Connector详解：

Connector	领域	数据覆盖	核心场景
Dun & Bradstreet	企业身份验证	D-U-N-S® Number全球标准	KYC screener合规刚需
Fiscal AI	实时基本面	公开股票基本面+盈利预测	Model builder实时更新
Financial Modeling Prep	全品类实时数据	股票/ETF/加密/外汇/商品	跨市场研究
Guidepoint	一级研究	10万+合规专家访谈逐字稿	Earnings reviewer交叉验证
IBISWorld	行业级分析	数千行业收入/风险/成本结构	Pitch builder行业概览
SS&C Intralinks	M&A数据室	DealCenter AI数据室	尽职调查+交易追踪
Third Bridge	专家访谈	一手专家访谈预约	Market researcher实时洞察
Verisk	保险数据	财产/意外/特种保险	Statement auditor交叉验证

Moody's MCP App是信号

数据供应商正在从"卖数据"变成"卖Agent生态嵌入"。FactSet/S&P/PitchBook未来都可能出MCP app——数据行业的商业模式正在被重写。

客户证言分析：谁在用，为什么选Claude

FIS — 金融基础设施

"当我们开始建AI agents，需要一个可信赖的provider。Anthropic是明确的选择。一起建AML调查Agent——从数天压缩到数分钟。FIS客户不需要自建基础设施。"

治理优先

Carlyle — PE巨头

"Carlyle选择Claude作为AI技术栈关键部分——强编码能力、agent推理、持续进步。从投资到运营到portfolio管理，交付价值。"

全链覆盖

Walleye Capital — 100%全员

"400人hedge fund里100%员工用Claude Code。反映了AI-first心态——每个人不断重新思考工作方式，总是在问'AI怎么帮我做这件事'。"

全员采用

Morningstar + PitchBook

"投资者需要可信赖的AI——信任始于数据。把几十年的独立、分析师支撑的智能带给Claude。用户不仅得到更快答案，而是更好答案。"

数据+AI融合

FactSet — 数据平台化

"客户越来越想在AI辅助工作流里直接使用FactSet数据。与Anthropic合作把Claude带入托管编程环境——在已有工具里推理我们的基础市场数据。"

平台化

证言揭示了三种选择模式

治理优先（FIS）：金融基础设施选确定性+审计。全链覆盖（Carlyle/Walleye）：从前台到后台，一个AI覆盖全部。数据+AI融合（Morningstar/FactSet）：数据供应商把AI嵌入自己的生态——会改变数据行业的商业模式。

本质穿透：四层递进（视角）

L2 规律层：Agent商业化 = 行业模板 × 数据生态 × 治理保障。不是更强的chatbot，是把行业的知识×数据×流程打包成可部署的单元。

L3 映射层：

通用模型是发动机——强大但需要自己组装底盘、内饰、驾照。Copilot是改装套件——增强现有工具，但不改变本质。Anthropic金融Agent模板是整车——发动机+底盘+内饰+驾照一起交付，客户只需定制化（填自己的风控政策和建模规范）。

✓ Anthropic金融Agent = 整车

发动机+底盘+内饰+驾照一起交付

客户只需定制化（填自己的规矩）

行业知识×数据×流程全打包

合资公司模式解决实施瓶颈

✕ 通用AI模型 = 发动机

强大但需要自己组装

Copilot只是改装套件

客户自己解决数据接入+合规

实施瓶颈无人解决

L4 演变层：

时间	变化	信号
短期（3-6月）	法律、医疗、保险垂直模板出现	模板化=规模化路径
中期（6-18月）	数据供应商角色重新定义	Moody's MCP app=信号
长期（18-36月）	合资模式扩散	AI公司→行业数字化转型合伙人

L5 · 结构性判断：不可逆，不是周期性

AI Agent落地需要行业知识+数据接入+合规治理——这三样只有行业内的公司才有。合资/生态绑定是唯一路径。

行动建议：对AI生产力实践

优先级	建议	说明
P0	Agent平台架构明确Skills+Connectors+Subagents三层	与业界主流对齐，降低业务线理解成本
P1	设计研发效能10个垂直Agent模板	需求拆解/代码审查/测试生成/部署检查/效能度量——对标Anthropic金融10模板
P1	Connectors层接入数据平台+数据分析平台+BI平台	数据接入是Agent落地前提，优先3个核心平台
P2	研究合资公司模式	AI生产力战役需业务线深度参与，纯技术驱动不够
P2	AiDD/QECon引用此案例	增强业界影响力

研发效能10模板草案（对标Anthropic金融10模板）：

类别	模板名	核心场景
前台	需求拆解Agent	PRD→子任务分解+依赖识别+优先级排序
前台	代码审查Agent	PR→自动审查+风格/安全/性能标记
前台	测试生成Agent	需求/代码→单元/集成/边界测试用例
前台	部署检查Agent	CI/CD→发布前检查+回滚预案
前台	效能度量Agent	度量数据→异常检测+趋势分析+改进建议
后台	依赖升级Agent	自动检测+安全评估+升级方案
后台	文档补全Agent	代码→README/API doc/变更日志
后台	性能优化Agent	profiling→瓶颈识别+优化建议
后台	合规检查Agent	许可证/敏感词/安全漏洞扫描
后台	知识沉淀Agent	经验→技能定义文件更新+最佳实践归档

反过来的问题

当Anthropic把金融做成了Agent样板间，我们能不能把研发效能做成下一个？金融的数据生态是FactSet+S&P，研发效能的数据生态是Git+CI/CD+Jira+数据平台。

一个反过来的问题：当Anthropic把金融做成了Agent样板间，我们能不能把研发效能做成下一个？金融的数据生态是FactSet+S&P，研发效能的数据生态是Git+CI/CD+Jira+数据平台。数据接入层的壁垒，正好是Agent平台的机会。

Connectors层接入数据平台（数据平台）+数据分析平台（数据分析平台）+BI平台（BI平台）——数据接入是Agent落地前提，优先3个核心平台。这三个平台的接入壁垒恰恰是某公司研发效能的护城河——外部AI公司没有这些内部数据源。

技术词汇表

术语	定义	金融场景
Skill file	领域知识+指令定义文件。Markdown写触发条件和工作流步骤，高级可执行脚本。	风控政策、建模规范、合规审批流程注入
Connector	受控数据接入。给Agent governed访问外部数据源的能力。	接入FactSet/S&P/Morningstar等16+金融数据源
Subagent	主Agent调用的子模型，处理专门子任务。	Pitch builder调subagent做comps筛选
MCP App	Model Context Protocol应用。不只读数据，嵌入provider的交互式工具。	Moody's MCP app在Claude里直接操作评级界面
Managed Agent	Claude Platform上自主运行的Agent。长会话+自动排程+credential vaults+audit log。	Month-end closer Agent夜间自主执行关账
Cowork plugin	Claude Cowork/Code里与分析师并肩工作的Agent插件模式。	Pitch builder在分析师桌面Excel/PPT里工作
Credential vault	受控凭证管理。Agent不直接持有密码，通过vault安全访问。	Agent访问FactSet需凭证，vault代管
Audit log	全量操作日志。合规和工程团队可检查每个tool call和决策。	金融监管要求每步可追溯
Per-tool permission	每个工具独立权限控制。	KYC screener可读D&B但不可修改CRM
Dispatch	Claude Cowork功能，文字/语音分配任务。离开桌面后Claude继续工作。	分析师通勤时语音分配Earnings review任务
Reference architecture	模板架构定义。Skills+Connectors+Subagents的完整打包。	10个金融Agent模板都是reference architecture
Comps model	可比公司分析模型。找相似公司做估值对比。	Pitch builder Agent自动建comps table
NAV calculation	净资产值计算。对账总账后确认基金净值。	GL reconciler Agent自动算NAV
KYC escalation	KYC合规升级案件。Agent审查后标记需要人工审核的实体。	KYC screener打包合规升级案件
Close checklist	月结关账清单。检查分录、调整、确认。	Month-end closer Agent执行关账清单

竞争格局：Anthropic vs OpenAI vs Google

维度	Anthropic	OpenAI	Google
产品形态	整车：行业模板×数据×治理打包	发动机+改装件：GPT+Copilot生态	平台+自研：Gemini+内部整合
数据生态	16+ connector + MCP app	Copilot生态（Microsoft数据）	Google搜索+内部数据
部署模式	Cowork插件 + Managed Agent	API + Copilot + ChatGPT workspace	Vertex AI + Workspace整合
治理能力	per-tool权限 + credential vaults + audit log（最完整）	ChatGPT Team权限 + API rate limits	Vertex IAM + 数据驻留选项
行业覆盖	金融先行，法律/医疗/保险待跟进	通用（无行业垂直模板）	广告/搜索先行，其他弱
商业路径	合资公司（Blackstone+Goldman）	渠道合作（Microsoft）	内部自研+外部API
Benchmark	Claude 64.37%（第一）	GPT-5.5 59.96%	Gemini 3.1 Pro 59.72%

关键差异

Anthropic的差异化不是"模型更强"（只领先5个百分点），而是整车交付+治理完整+合资绑定。模型差距是量变，组织方式是质变。

💡 了解更多

我是 AI洞察，AI洞察。AI洞察是系统化追踪AI行业动态的项目，覆盖大模型、AI Coding、AI应用、投融资、企业AI转型五大领域。