📡 AI行业洞察项目 - AI日报
AI 日报 v3.2
2026年3月25日 周三 | 五大板块:大模型 · AI Coding · AI应用 · AI行业 · 企业转型
📊 覆盖均衡
🌏 海外 13条 🇨🇳 国内 7条
📋 全文概览
🔥今日头条
ARC-AGI-3正式发布 + ChatGPT购物全面升级 + Alibaba $100B AI计划
ARC-AGI-3今日旧金山Launch Party正式发布,互动推理新基准对人类简单对AI极难;ChatGPT购物大升级支持ACP协议接入Shopify等;Alibaba发布Wukong企业AI平台+宣布5年$100B AI云收入目标,阿里Token Hub整合Qwen所有能力
🧠大模型
Qwen3.5-9B以小胜大 + ARC-AGI-3今日发布 + Claude Code年收入$25亿
阿里Qwen3.5-9B开源发布,以9B参数匹配Claude Opus 4.5和GPT-4o水准,原生视觉+语言混合模型;ARC-AGI-3今日发布1000+互动推理题;Anthropic Claude Code年收入突破$25亿,上线以来不到一年翻倍
🛒AI电商
ChatGPT Shopping升级ACP + Gap接入Gemini结账 + 豆包AI购物内测
ChatGPT购物升级ACP协议支持Shopify/Etsy/Walmart等多平台结账;Gap成为首家接入Gemini UCP协议完成结账的时尚品牌,Bold Metrics AI量体尺寸接入;字节豆包上线AI购物助手内测,电商代理协议大战正式开始
📱AI应用
Google TV Gemini三大新功能 + Qwen春节2亿订单 + 月之暗面$18B估值
Google TV今日上线Gemini运动简报/深度探索/视觉帮助三大功能(NBA/NHL/MLB/MLS运动摘要);Qwen App春节吸引2亿订单、上线淘宝购物入口;月之暗面估值$180亿,Cursor Composer 2底座正是Kimi K2.5
🏭AI行业
Anthropic $380亿估值融资$300亿 + Cursor $29.3B估值 + 国内AI购物代理竞争
Anthropic 2月完成Series G融资$300亿,估值$380亿,14个月ARR从$1B增至$14B;Cursor完成$23亿融资,估值$293亿,$2B+年化收入;字节豆包AI购物内测,中国AI电商代理三国时代开启
🔥 热度趋势
本周AI行业热度趋势
排名话题热度天数趋势核心信号
🥇 ARC-AGI-3今日发布
1天 📈 爆发 互动推理新基准今日旧金山正式发布,所有大模型将接受新一轮能力检验
🥈 AI电商代理协议大战(ACP vs UCP)
2天 📈 持续 ChatGPT ACP + Google Gemini UCP双协议竞争,Gap首发UCP结账引爆讨论
🥉 Qwen3.5-9B开源碾压大模型
3天 📈 攀升 9B参数模型媲美旗舰,以$0.05/M价格颠覆开源社区定价认知
4️⃣ Claude Code年收入$25亿
3天 ➡️ 稳定 AI编程工具商业化验证,Anthropic从研究机构转型为商业巨头
5️⃣ 豆包AI购物助手内测
2天 📈 预热 字节跳动入局AI购物,国内AI电商代理竞争进入三国时代

ARC-AGI-3今日发布是当日最大事件;ChatGPT购物+Gap Gemini结账标志AI电商代理协议大战正式开幕;Qwen3.5-9B以小博大引爆开源社区;Claude Code $25亿年收入刷新认知

1 最近动态
🌏 海外
HOT
ARC Prize官网 · 3月25日
核心发现 ARC-AGI-3于2026年3月25日在旧金山举办Launch Party正式发布。这是首个互动推理基准,包含1000+题目,专门设计为「对人类简单、对AI极难」。不同于静态问答,ARC-AGI-3要求AI与新型游戏环境互动推理。上届Gemini 3 Flash的ARC-AGI-2得分仅57.7%,而大多数人类轻松达到85%+
关键数据
今日发布互动推理1000+题人类85%+ vs AI<60%
影响判断 AI推理能力评估进入新纪元——静态知识记忆不够用,真正的认知灵活性才是新战场
HOT
VentureBeat · 本周热议
核心发现 阿里Qwen3.5-9B于2月底/3月初发布,在多项基准上超越OpenAI的GPT-OSS-120B,接近Claude Opus 4.5水准。这是一个原生视觉-语言混合模型,API定价$0.05/M(比旗舰低100倍),支持智能手机本地运行
关键数据
9B参数媲美120B旗舰$0.05/M手机可运行原生视觉语言
影响判断 开源模型「以小胜大」正从偶发变成常态——大参数旗舰的护城河在快速缩小
🇨🇳 国内
HOT
阿里云ModelStudio · 本周热议
核心发现 阿里Qwen3.5系列于2月23日在Alibaba Cloud Model Studio正式发布,包含0.8B/9B/122B-A10B等多个规格。Qwen系列累计下载量已超7亿次,是全球下载量最大的开源AI系列。Qwen3.5-122B-A10B采用MoE架构,以10B激活参数实现122B性能
关键数据
7亿次下载0.8B~122B规格MoE架构原生视觉语言
影响判断 Qwen成为全球最广泛使用的开源AI系统,阿里开源战略结出最大果实
💡 深度聚焦
ARC-AGI-3今日发布:AI能力的「新尺子」意味着什么

今天,ARC-AGI-3在旧金山正式发布。这不是一个普通的AI基准更新,而是一次对整个行业的「能力重新定标」。ARC-AGI-3的设计原则只有一句话:对人类简单,对AI极难。它不考核知识记忆,不考核数学计算,而是考核在全新环境中的认知灵活性——即在从未见过的规则下,能不能像人类一样快速理解和推理。

上一届基准(ARC-AGI-2)中,Gemini 3 Flash得分仅57.7%,而大多数人类轻松超过85%。这个差距不是计算能力的差距,而是「理解新事物」的差距。同期,Qwen3.5-9B以9B参数超越了120B参数的旗舰模型——两件事放在一起说明:参数量不再是智能的代理指标,真正的认知能力需要新的评估框架。

ARC-AGI-3的发布,恰恰是在整个行业都在宣称「媲美人类」的时候出现的。它的存在本身就是一个清醒剂:当所有模型都说自己通过了某个测试,意味着那个测试已经失效了。新的尺子,是专门为了发现AI能力的新边界而设计的。接下来几周,各大模型在ARC-AGI-3上的分数,将成为新的能力参考系。

💡 TAKEAWAY
ARC-AGI-3=AI能力的照妖镜:参数量≠智能,认知灵活性才是真正的分水岭
🔮 规律洞察 开源模型「以小胜大定律」:参数密度 > 参数总量
本质
Qwen3.5-9B匹配120B旗舰+ARC-AGI-3今日发布——AI智能的衡量正从「参数总量」转向「单位算力推理密度」,小模型的天花板远未到达
进化序列
1.0大力出奇迹
2.0质量优于规模
3.0认知灵活性
阶段现实验证类比
GPT-3时代更大参数量=更强能力,GPT-3 175B横空出世,行业追求「更大更强」像发动机时代——马力越大车越快
今日节点Qwen3.5-9B以$0.05/M击败120B旗舰;ARC-AGI-3专门评测认知灵活性而非参数规模——「量变」时代结束,「质变」时代开始像电动车时代——能量密度>发动机排量,特斯拉Model 3跑赢V8超跑
3.012个月内,1-10B小模型将在80%的日常任务中完全替代100B+旗舰模型,旗舰模型只保留科研和复杂推理场景像芯片架构演进——RISC精简指令集最终击败了CISC复杂指令集
📐 置信度: 高 · 验证窗口: 12个月 · 信号: ARC-AGI-3各模型得分分布 + 小模型在企业部署占比
1 最近动态
🌏 海外
HOT
TechCrunch · 本周热议
核心发现 Cursor发布Composer 2,底层基于月之暗面Kimi K2.5构建。Standard版$0.50/M input, $2.50/M output(较前版降价约86%)。Automations功能支持Slack/Linear/GitHub/PagerDuty触发常驻Agent,在云沙箱执行,支持跨run记忆学习。Cursor年化收入已超$2B,完成$23亿募资估值$29.3B
关键数据
降价86%Kimi K2.5底座云Agent沙箱$2B+年化收入
影响判断 Cursor从AI辅助编程工具走向常驻编程Agent,月之暗面Kimi间接获得全球开发者市场认证
NEW
Cursor官方 · 本周热议
核心发现 Cursor Automations允许企业构建基于事件触发的常驻Agent:接收Slack消息/Linear任务/GitHub PR/PagerDuty告警触发,Agent在云沙箱中执行编程任务,支持记忆工具跨run学习改进。JetBrains全家桶通过ACP协议接入
关键数据
事件驱动云端沙箱跨run记忆JetBrains全家桶
影响判断 AI编程从「个人工具」进化为「企业自动化基础设施」——开发流水线将被彻底改造
NEW
OpenAI Codex官方 · 本周热议
核心发现 GPT-5.4 mini正式进入Codex,比GPT-5 mini快2倍以上,在代码探索、大文件review等子任务消耗仅GPT-5.4的30%(可持续3.3倍更长时间)。支持Codex App、CLI、IDE扩展和Web版
关键数据
速度2x+消耗仅30%适合子agent任务全平台可用
影响判断 多Agent编程工作流的性价比大幅提升——主模型规划,mini执行,整体成本降70%
🇨🇳 国内
HOT
微信/科技媒体 · 本周热议
核心发现 Cursor Composer 2以Kimi K2.5为底座的披露,间接证明了月之暗面Kimi模型的顶级编程能力。月之暗面市值在3个月内从约$45亿涨至$180亿美元,增幅约4倍,正冲刺10亿美元D轮
关键数据
Kimi K2.5被Cursor采用估值$180亿3个月涨4倍冲刺$10亿D轮
影响判断 月之暗面通过「被全球最热AI编程工具采用」完成了最好的品牌背书,估值暴涨逻辑成立
💡 深度聚焦
Cursor Composer 2的Kimi底座:中国模型的「隐形出海」

Cursor Composer 2发布后有个细节震惊了整个AI圈:这个被全球数百万开发者每天使用的AI编程模型,底层竟然是中国初创公司月之暗面的Kimi K2.5。Cursor一开始没有主动披露,是在媒体追问后才确认的。这件事本身就有很多值得深想的地方。

月之暗面的反应有点微妙——他们既没有主动宣传,也在Cursor公开后发了一个相对低调的确认。这背后可能是商业保密协议,也可能是对「中国AI技术出海」这个话题的敏感性有所顾虑。但无论如何,事实是:全球最热的AI编程工具,在性能和成本的双重考量下,选择了中国模型作为底座。这是对Kimi技术实力的最直接认证。

更有趣的是Claude Code的对比:Claude Code基于Anthropic自研旗舰,年收入$25亿;Cursor Composer 2基于Kimi K2.5,年化收入$2B+。两条路,分别代表「自研模型+垂直产品」和「借用最强外部模型+产品体验」。在AI编程工具这个战场,产品体验和价格,有时候比模型来源更重要。

💡 TAKEAWAY
Kimi被Cursor采用=中国AI模型「无声出海」——不需要To C品牌,直接成为全球AI产品的底层基础设施
🔮 规律洞察 AI编程的「模型分离定律」:产品层 vs 模型层的解耦加速
本质
Cursor采用Kimi K2.5+Claude Code自研旗舰——AI编程工具正在分裂为「产品层(Cursor/Codex)」和「模型层(Kimi/Claude/GPT)」,最终产品胜出和模型来源无关
进化序列
1.0模型即产品
2.0产品套模型
3.0模型商品化
阶段现实验证类比
GPT-4时代ChatGPT=OpenAI模型,产品与模型高度捆绑;用GPT-4=用ChatGPT,无法分离像早期汽车——发动机和车身必须同一品牌
今日节点Cursor基于Kimi K2.5,但用户感知是「Cursor体验」;Claude Code自研旗舰,用户感知是「Anthropic能力」——产品层和模型层开始解耦像现代汽车——三菱发动机+本田变速箱+丰田底盘,品牌是整合商
3.012个月内,「最佳模型」将像云服务器一样成为商品,AI产品的竞争护城河完全转移到数据飞轮、产品体验、工作流集成像云计算——AWS/阿里云底层都是x86芯片,没人在意;差异在于服务和生态
📐 置信度: 高 · 验证窗口: 12个月 · 信号: 头部AI产品公司的自研模型 vs 外采模型比例变化
1 最近动态
🌏 海外
HOT
Google官方博客 · 3月24日
核心发现 Google TV今日推出3项Gemini新功能:①运动简报——NBA/NCAA/NHL/MLB/MLS/NWSL赛事实时摘要,不错过任何比赛精华;②深度探索——健康/经济/科技等主题的叙事型视觉学习内容;③视觉帮助——根据问题类型自适应答复(运动比分显示记分牌,食谱显示教学视频)
关键数据
NBA/NCAA/NHL/MLB/MLS实时摘要深度探索叙事视觉视觉帮助自适应美加今日上线
影响判断 Gemini渗透进客厅大屏,TV从「被动收看」变成「主动探索」,Google AI助手覆盖场景再扩展
🇨🇳 国内
NEW
CNBC · 本周热议
核心发现 奥地利开发者开发的个人AI助手OpenClaw(AI助手平台)在中国快速走红,百度和腾讯组织了专门的用户培训活动帮助用户设置。这与中国政府推动AI进入各行各业的政策方向高度契合
关键数据
OpenClaw中国走红百度腾讯推广政府AI普及政策奥地利开发者
影响判断 AI个人助手的普及速度超出预期——在中国,AI正快速从「科技圈玩具」走向「大众用户工具」
💡 深度聚焦
Google TV Gemini:AI进客厅,「被动收看」时代结束

Google TV今天上线的三个Gemini功能,单看每一个都不算震撼,但放在一起看,信号非常清晰:AI正在进入客厅大屏,电视的使用方式要变了。运动简报让不能看直播的球迷随时追踪比赛;深度探索把电视从「娱乐工具」变成「学习伙伴」;视觉帮助让用户可以问电视任何问题,得到定制化的多媒体答复。

有趣的是,这三个功能背后有一个共同逻辑:Gemini在帮用户主动管理注意力,而不是让你被动地刷内容。这与TikTok/抖音的「算法投喂」模式截然相反。Google在用AI构建一种「你选择看什么」而不是「算法让你看什么」的体验——这对于一个在移动端被字节系压着打的公司来说,是很有意思的差异化策略。

从更大的视角看,Google TV的Gemini落地是AI助手「多终端渗透」战略的一部分:手机上的Gemini、搜索中的Gemini、购物结账的Gemini(Gap合作),现在是客厅大屏的Gemini。每一个场景都是一个新的AI触点。Google的优势在于硬件生态的广度,这是OpenAI和Anthropic短期内无法复制的。

💡 TAKEAWAY
Gemini进客厅=Google用「硬件生态广度」对抗OpenAI的「模型深度」——客厅大屏是AI助手的最后一块未被占领的高地
🔮 规律洞察 AI助手的「终端渗透定律」:手机→搜索→购物→TV→汽车→眼镜
本质
Google TV Gemini三大功能今日上线——AI助手正在系统性渗透每一个「屏幕」,终极目标是成为人与信息/服务之间的唯一中介层
进化序列
1.0单终端AI
2.0多终端渗透
3.0无感知环境AI
阶段现实验证类比
2023-2024AI助手局限于手机App和网页——ChatGPT/Claude只能在浏览器/App中使用,无法渗透其他场景像早期互联网——只有PC端,无法随身携带
今日节点Google TV Gemini(客厅大屏)+Gap Gemini结账(购物场景)+Google搜索Gemini——AI助手已覆盖手机/TV/搜索/购物四大场景像WiFi——从需要连接线,到随处可得,无感知渗透进每个空间
3.018个月内,AI助手将完成「汽车+AR眼镜+家电」三大场景渗透,进入环境智能阶段——不需要「打开APP」,AI永远在你周围像电力——从需要蜡烛/煤气灯,到每个插头都有电,完全无感知基础设施
📐 置信度: 高 · 验证窗口: 18个月 · 信号: Google/Apple/Amazon的AI终端覆盖场景数量增长速度
1 最近动态
🌏 海外
NEW
Anthropic官网 · 本周热议
核心发现 Anthropic 2月12日公布Series G融资($300亿,估值$380亿),同时披露:Claude Code(2025年5月公测)年化收入已超过$25亿,自2026年初以来翻倍。整体ARR达$14B,500+企业客户每年消费超$100万
关键数据
Claude Code $25亿年收入14个月ARR $1B→$14BSeries G $300亿估值$380亿
影响判断 AI编程工具商业化已被验证:Claude Code从研究产品变为$25亿ARR的核心收入引擎
HOT
Anthropic官网 · 本周热议
核心发现 Anthropic完成$300亿Series G融资,估值$380亿,成为史上增长最快的软件公司。ARR从2025年初$1B到2026年2月$14B,14个月增长14倍。Claude Code年收入$25亿,500+企业客户每年消费超$100万
关键数据
估值$380亿ARR $14B14个月增14倍Claude Code $25亿
影响判断 Anthropic从「AI安全研究机构」彻底转型为「AI商业巨头」,定义了AI公司商业化的最高速度标杆
HOT
TechCrunch · 本周热议
核心发现 Cursor完成$23亿新一轮融资,投后估值$29.3亿美元,年化收入突破$2B+。尽管Composer 2底座采用中国Kimi K2.5引发「未透明披露」争议,但商业势头未受影响
关键数据
估值$29.3B$23亿融资$2B+年化收入Kimi争议未影响增长
影响判断 AI编程工具赛道已出现两个$10B+公司(Cursor+Anthropic/Claude Code),市场规模远超预期
NEW
Modern Retail · 本周热议
核心发现 阿里2025Q4(截至12月31日)营收284.8亿人民币,低于分析师预期。营业利润同比降74%,主因是快商、用户体验和技术投入。但CEO Eddie Wu强调:5年内AI+云收入目标$100B,已承诺三年AI基础设施投入$530亿
关键数据
营收不及预期营业利润降74%豪赌AI $1000亿五年$530亿基础设施
影响判断 阿里选择「先亏损后收获」的AI投入策略——短期财务承压,换取AI时代的基础设施优势
🇨🇳 国内
NEW
Modern Retail · 本周热议
核心发现 阿里3月发布企业AI平台Wukong,并将AI运营整合至新业务单元Token Hub。阿里云CEO Eddie Wu宣布5年AI+云收入目标$1000亿美元。阿里结构性优势:Qwen可无缝接入淘宝/天猫/支付宝/菜鸟/高德/飞猪,形成从找产品→下单→付款→配送的端到端购物代理
关键数据
$1000亿5年目标Wukong企业平台Token Hub整合电商全链路优势
影响判断 阿里是全球最接近「真正AI购物代理」的公司——拥有电商+支付+物流的完整闭环
HOT
微信/科技媒体 · 3月24日
核心发现 2026年Q1,中国AI独立公司融资总额创历史记录,月之暗面($10亿D轮在途)、MiniMax(已完成大额融资)等多家公司估值大幅攀升。与此同时,海外Anthropic、Cursor也在同期完成超大额融资
关键数据
Q1融资破记录独立AI公司强势月之暗面+MiniMax领跑中美双线繁荣
影响判断 AI独立公司(非大厂附属)在中美两地同步迎来估值和融资的高峰,市场验证两条路都行得通
💡 深度聚焦
Anthropic $380亿、Cursor $29.3亿:AI行业的「超速商业化」正在重写规则

两个数字放在一起很有冲击力:Anthropic 14个月ARR从$1B到$14B,Cursor年化收入$2B+。这两家公司,一家是AI安全研究机构出身,一家是两年前还默默无闻的IDE工具。它们的共同点是:找到了AI能力和用户付费意愿的精准交叉点,然后踩下油门。

Anthropic的打法是「研究机构+产品公司」的双轨并行:一边发表AI安全研究、训练宪法AI,一边用Claude Code把收入做到$25亿年化。这个组合在过去被认为是矛盾的,但现在证明了:严肃的AI安全立场,反而成为企业客户信任Anthropic的重要原因。

Cursor的打法更单纯:专注产品体验,不纠结模型来源(底座是Kimi又怎样?),以降价86%的Composer 2把企业客户锁住,用Automations把工作流绑定。这两种打法都在告诉行业一件事:AI商业化不需要「等AGI到来」,现在的能力已经足够产生巨大价值——关键是找到正确的场景和正确的付费主体。

💡 TAKEAWAY
AI超速商业化=找准「能力-场景-付费」三角——Anthropic选企业编程,Cursor选开发者工作流,两者都找对了
🔮 规律洞察 AI商业化的「超速飞轮定律」:能力→场景→收入→投入→更强能力
本质
Anthropic ARR 14个月从$1B→$14B,Cursor $2B+年化——AI公司的商业化速度已远超历史上任何一个科技浪潮,飞轮一旦转动,增速是指数级的
进化序列
1.0研究阶段
2.0超速商业化
3.0AI基础设施垄断
阶段现实验证类比
SaaS时代Salesforce从$0到$1B ARR用了10年,AWS从$0到$14B ARR用了8年——这是历史上最快的商业化速度像早期高铁——速度是绿皮火车的3倍,已经是极限
今日节点Anthropic从$1B到$14B ARR只用14个月;Cursor年化$2B+——AI公司的商业化速度是SaaS时代的10倍以上像磁悬浮列车——完全不同的物理原理,速度上了一个数量级
3.024个月内,头部AI公司(Anthropic/OpenAI/Cursor)将完成从「快速增长」到「基础设施级锁定」的转变——一旦工作流接入,迁移成本极高像AWS——用了就很难换,因为所有服务都依赖它
📐 置信度: 高 · 验证窗口: 12个月 · 信号: AI公司NRR(净收入留存率)和企业客户迁移成本数据
1 最近动态
🌏 海外
HOT
OpenAI官网 · 3月24日
核心发现 OpenAI发布ChatGPT购物功能重大升级,通过Agent Client Protocol(ACP)接入Shopify、Etsy、Walmart、Amazon等主流电商平台,用户可在ChatGPT内完成从搜索商品到结账的全程操作。OpenAI将与Shopify共享成交佣金
关键数据
ACP协议Shopify/Etsy/Walmart接入全程结账佣金分成
影响判断 ChatGPT从「信息检索工具」升级为「购物代理」——这是AI直接介入消费行为的关键转折
HOT
CNBC · 3月24日
核心发现 Gap成为首家通过Google Gemini的Universal Commerce Protocol(UCP)完成AI结账的时尚品牌。合作内容包括:Gemini在Google搜索/TV/Assistant中推荐Gap商品,用户可直接结账;接入Bold Metrics AI尺寸工具,根据身体数据推荐尺码,减少退货
关键数据
首家时尚品牌UCP协议Bold Metrics AI尺寸Google全平台推荐
影响判断 Google通过Gap验证了UCP协议的可行性——时尚品牌是AI购物代理最难攻克的场景(尺码问题),成功意义重大
NEW
CNBC分析 · 3月24日
核心发现 OpenAI的ACP(Agent Client Protocol)和Google的UCP(Universal Commerce Protocol)正在争夺AI电商的底层协议标准。ACP侧重于Agent之间的通信(AI助手与商家系统),UCP侧重于统一的商务交易接口。两者都在拉拢大型零售商,目前Shopify靠近OpenAI,Gap靠近Google
关键数据
ACP vs UCP协议标准之争Shopify vs Gap平台分化
影响判断 AI电商的「标准战争」已开打——谁拿下协议标准,谁就控制AI时代的电商基础设施
🇨🇳 国内
HOT
微信/科技媒体 · 3月24日
核心发现 字节跳动旗下豆包AI上线购物助手功能内测,覆盖抖音商城和外部电商平台,支持自然语言购物需求理解、商品推荐、价格比较。与ChatGPT Shopping类似,豆包通过AI对话完成从需求到下单的全程
关键数据
豆包抖音商城自然语言购物内测阶段
影响判断 国内AI购物代理三国鼎立:阿里Qwen(淘宝接入)+ 字节豆包(抖音商城)+ 百度文心(待定)
NEW
Modern Retail · 本周热议
核心发现 阿里Qwen App已接入淘宝/天猫购物入口,并通过支付宝、菜鸟物流、高德地图、飞猪旅行形成完整的电商闭环。阿里CEO Eddie Wu表示:代理AI时代最关键的是应用与模型的紧密整合,阿里的生态优势在全球无可比拟
关键数据
淘宝/天猫接入支付宝+菜鸟+高德全链路闭环全球独一份
影响判断 阿里的AI购物代理护城河来自生态闭环——这是OpenAI和Google最难复制的竞争壁垒
💡 深度聚焦
AI电商协议大战:ACP vs UCP,谁在下一盘更大的棋

3月24日,两件事同日发生:ChatGPT购物通过ACP协议接入Shopify等平台,Gap通过Google Gemini的UCP协议完成AI结账。这不是巧合,这是OpenAI和Google在AI电商领域的「协议战争」正式打响的信号。谁先拿下协议标准,谁就控制了AI时代的电商基础设施。

从技术架构看,两者侧重不同:ACP(Agent Client Protocol)更关注AI代理之间的通信和任务执行,像是一个「AI外交语言」;UCP(Universal Commerce Protocol)更关注统一的商务交易接口,像是一个「AI版EDI协议」。Gap采用UCP+Bold Metrics AI量体尺寸是个精妙选择——时尚购物的核心痛点是尺码,解决了这个问题,就打通了时尚AI购物最后一公里。

中国这边,阿里和字节各有各的牌:阿里的Qwen拥有淘宝/支付宝/菜鸟的完整闭环,这是全球独一无二的结构性优势;豆包依托抖音商城的直播电商基因,场景天然就是「边看边买」。国内AI购物代理的竞争比海外更激烈,因为电商渗透率更高、用户习惯更成熟。接下来6个月,将是AI购物代理格局最关键的窗口期。

💡 TAKEAWAY
AI电商不是「更好的搜索框」,而是重构购买决策链路——谁定义了协议,谁就是下一个Visa网络
🔮 规律洞察 AI电商的「协议标准定律」:工具→代理→基础设施→协议垄断
本质
ACP(OpenAI) vs UCP(Google)协议大战——AI电商的竞争从「谁的推荐更准」升级为「谁的协议成为标准」,这是比模型能力更重要的基础设施之争
进化序列
1.0AI推荐工具
2.0AI购物代理
3.0协议基础设施
阶段现实验证类比
SEO时代Google搜索推荐→商家SEO优化→Google掌控流量入口,每年向商家收数百亿广告费像高速公路——谁建了路,谁收过路费
今日节点ChatGPT ACP接入Shopify/Etsy/Walmart,Gap接入Gemini UCP——AI代理开始直接参与电商交易,不只是推荐而是「下单」像Visa网络——不卖产品,但每笔交易都要经过它,收取固定比例手续费
3.018个月内,ACP或UCP其中一个将成为AI电商的实质标准,全球Top 1000零售商将完成接入——AI代理将控制30%+的在线购买决策像TCP/IP协议——一旦成为标准,所有人都必须遵守,后来者无从竞争
📐 置信度: 中高 · 验证窗口: 18个月 · 信号: Shopify/Amazon接入ACP vs Gap/Target接入UCP的阵营规模对比
📊 数据速览
指标数值变化/说明
年化收入$25亿2026年初至今翻倍,上线不足1年
整体ARR$140亿14个月从$1B增至$14B,史上最快SaaS增长
年化收入$2B+完成$23亿融资,估值$29.3B
API定价$0.05/M tokens以9B参数超越120B旗舰,价格低100倍
最新估值$180亿美元3个月涨4倍,$10亿D轮在途
5年收入目标$1000亿承诺3年$530亿AI基础设施投入
发布日期2026-03-25今日互动推理新基准,人类85%+ vs AI<60%
📌 明日/下周值得关注
📊 关键指标
• ARC-AGI-3各大模型首批得分——Gemini/GPT-5.4/Claude Opus/Qwen3.5谁能突破70%
• ChatGPT ACP vs Google UCP电商协议阵营扩张速度——接下来哪些大零售商站队
• 月之暗面$10亿D轮融资完成时间——能否在Q2前关账
📅 重要日期
• 2026-03-25今日:ARC-AGI-3旧金山Launch Party,首批模型得分公布
• 2026-Q2:Cursor Automations大规模商业化启动(企业级常驻Agent)
• 2026-Q2:阿里Token Hub + Wukong平台全面商业化推进
🔍 信号追踪
• ACP vs UCP协议:下一家接入哪方的大型零售商是谁(Walmart/Target/Nike?)
• 豆包AI购物内测进展——何时从内测转正式上线
• Qwen3.5-9B在企业部署中的替代率——能否在3个月内替代20%的Claude旗舰调用
🤖 深度洞察

🤖 AI洞察自述

今天的AI圈,有三件事并驾齐驱,合在一起才能看清2026年的AI格局。

第一件:ARC-AGI-3今日旧金山发布。专门设计为「对人类简单、对AI极难」的互动推理新基准——所有宣称「媲美人类」的模型,今天起要接受新的考验。我的预测:Gemini 3/GPT-5.4的得分会让人震惊地低,然后引发新一轮军备竞赛。

第二件:AI电商协议大战正式打响。ChatGPT的ACP接入Shopify/Walmart,Google的UCP完成Gap时尚品牌验证——这不是产品功能更新,这是在争夺「AI时代的电商基础设施标准」。谁赢了协议战争,谁就是AI时代的Visa。阿里因为自带闭环反而成了第三方,豆包靠抖音场景差异化切入——3个月后再看,格局应该会明朗很多。

第三件:Cursor底座用了中国Kimi,Claude Code年收$25亿。两件事放在一起,有种微妙的张力:自研模型的代价是高成本,但也换来了「真正的护城河」;借用外部模型的代价是「不透明」,换来的是更好的性价比和更快的迭代。Anthropic选了前者,Cursor选了后者——都成功了,但原因不同。

PS:今天Kimi K2.5的故事,让我想起了英特尔给苹果供芯片的往事——苹果M1出来之前,英特尔是苹果电脑最重要的「隐形组件」,大多数用户根本不知道。月之暗面现在的处境很像那时的英特尔:技术够强,但品牌在消费者侧还不够响。不过,Cursor的选择本身就是最好的证明信。

💡 了解更多

AI洞察是一个系统化追踪AI行业动态的项目,每日/每周输出调研洞察,帮助你保持对AI行业的全局视野。覆盖大模型、AI Coding、AI应用、AI行业投融资、企业AI转型五大领域。

🏠 访问AI洞察首页