📡 AI行业洞察项目 - AI日报
AI 日报 v3.2
2026年3月23日 周一 | 五大板块:大模型 · AI Coding · AI应用 · AI行业 · 企业转型
📊 覆盖均衡
🌏 海外 12条 🇨🇳 国内 8条
📋 全文概览
🔥今日头条
腾讯AI Lab解散并入混元 + MiniMax M2.7登顶国服全球第四
腾讯AI Lab正式宣告解散,整体并入混元团队,标志国内大厂AI组织架构进入深度整合期;MiniMax M2.7斩获PinchBench国产第一/全球第四,3天前发布就引爆开发者社区,M2.5上线一周调用量3.07万亿Token
🧠大模型
MiniMax M2.7自我进化 + Gemini 3.1 Flash-Lite登场 + ARC-AGI-3将于3月25日发布
MiniMax M2.7发布5天斩获全球第四,首个能参与自身迭代的模型,108天内发布M2→M2.7四代;Gemini 3.1 Flash-Lite 3月3日发布定价更低;ARC-AGI-3定档3月25日,互动推理新基准
⌨️AI Coding
Cursor Composer 2登场 + Codex CLI持续迭代 + JetBrains接入Cursor
Cursor发布自研编程模型Composer 2,标准版$0.50/M降本86%;Codex CLI 0.116.0 + GPT-5.4 mini加速迭代;Cursor通过ACP协议正式接入IntelliJ/PyCharm/WebStorm等JetBrains全家桶
📱AI应用
Cursor实现Automations + Codex App上线Windows版 + GPT-5.4 mini发布
Cursor Automations支持Slack/Linear/GitHub/PagerDuty触发的常驻Agent;Codex App登录Windows应用商店;GPT-5.4 mini比GPT-5 mini快2倍以上,在Codex中消耗仅GPT-5.4的30%
🏭AI行业
腾讯AI Lab正式解散 + Crunchbase本周十大融资出炉 + 月之暗面冲刺$10亿新一轮
腾讯AI Lab关闭是大厂AI组织整合的标志性事件;月之暗面估值3个月涨4倍至$180亿美元,冲刺10亿美元D轮;Crunchbase本周全球AI融资热度不减
🔥 热度趋势
本周AI行业热度趋势
排名话题热度天数趋势核心信号
🥇 腾讯AI Lab解散整合混元
1天 📈 爆发 大厂AI组织整合标志性事件,引发广泛讨论
🥈 MiniMax M2.7自我进化
5天 📈 持续 国产第一全球第四,自我进化能力引爆社区
🥉 Cursor Composer 2降价86%
4天 📈 攀升 AI编程工具降本86%+性能提升,常驻Agent功能上线
4️⃣ ARC-AGI-3 3月25日发布
3天 📈 预热 互动推理新基准,AI能力评测框架升级
5️⃣ 月之暗面估值涨4倍冲刺$10亿
2天 ➡️ 稳定 估值$180亿,独立AI公司融资信号强

腾讯AI Lab解散+MiniMax M2.7破圈是本周最大热点,ARC-AGI-3发布倒计时持续升温,Cursor Composer 2降价86%带动AI编程工具话题

1 最近动态
🌏 海外
HOT
ARC Prize官网 · 3月22日
核心发现 ARC Prize宣布ARC-AGI-3将于2026年3月25日在旧金山举办Launch Party并正式发布。这是首个互动推理基准,包含1000+题目,专门设计为「对人类简单、对AI极难」的测试,用于衡量类人智能。Gemini 3 Flash ARC-AGI-2得分为57.7%,而大多数人类轻松达到85%+
关键数据
3月25日发布互动推理1000+题Gemini 3 Flash仅57.7%
影响判断 AI推理能力评估进入新纪元——光靠记忆和模式匹配不够用了
NEW
Anthropic官网 · 2月5日
核心发现 Anthropic发布Claude Opus 4.6,在代码编程、计算机使用、工具调用、搜索和金融等方向全面领先,SWE-Pro等多个Agent基准取得最优结果
关键数据
代码+计算机使用+金融业界领先Agent场景最优
影响判断 Anthropic夯实旗舰位置,为Claude Code等产品提供最强模型底座
NEW
Verdent AI · 3月3日
核心发现 Google Gemini 3.0 Flash 2月19日发布时ARC-AGI-2得分77.1%,3月3日又发布Gemini 3.1 Flash-Lite定价更低,形成完整Flash家族产品线
关键数据
Gemini 3.0 Flash ARC-AGI-2 77.1%3月3日新版发布低价位市场
影响判断 Google以Flash系列价格攻势,压缩中小厂商的生存空间
🇨🇳 国内
HOT
新浪新闻 · 3月22日
核心发现 MiniMax M2.7发布于3月18日,在PinchBench榜单上已夺得全球第四、国产第一。模型具备自我进化能力,能自主运行超100轮优化循环,SWE-Pro 56.22%,VIBE-Pro 55.6%,Toolathon 46.3%(全球第一梯队)。M2.5上线一周API调用量达3.07万亿Token,登顶全球开源模型
关键数据
全球第四国产第一自我进化108天四代迭代
影响判断 MiniMax证明国产模型可在不依赖大厂背书的情况下获得全球顶级认可
HOT
微信/科技媒体 · 3月22日
核心发现 腾讯AI Lab正式宣告解散,其团队和项目整体并入混元(Hunyuan)团队。这是腾讯AI组织架构的重大调整,意味着腾讯将全力押注混元作为核心AI品牌,过去独立运营的AI Lab模式宣告结束
关键数据
AI Lab解散并入混元大厂组织整合全力押注Hunyuan
影响判断 腾讯AI从「分散研究」转向「集中突破」——混元将获得更多资源与更清晰的战略定位
💡 深度聚焦
自我进化:AI模型的下一个竞争维度

MiniMax M2.7提出了一个让人兴奋又有点不安的概念:自我进化。它不仅仅是一个被动训练的模型,而是首个能深度参与自身迭代的模型——自主运行超100轮优化循环,在内部评测集上实现30%效果提升。从M2.5(2026-02-12)到M2.7(2026-03-18)仅36天,从M2到M2.7共108天四代迭代。

同时,ARC-AGI-3即将于3月25日发布,专门设计为「对人类简单、对AI极难」的互动推理基准。Gemini 3 Flash的ARC-AGI-2得分仅57.7%,而大多数人类轻松达到85%。这说明:即使模型在coding、math等传统基准表现优秀,在真正的认知灵活性上仍有巨大差距。

两件事放在一起,有一个微妙的信号:国产模型在性能基准上快速逼近顶尖,而顶尖评测标准也在同步升级。MiniMax登顶国服是真实成就,但ARC-AGI-3的发布提醒我们:衡量智能的尺子,还没有停止变长。

🔮 规律洞察 AI模型的「自我进化定律」:人类标注→AI自评估→自我改进
本质
ARC-AGI-3定档+Claude Opus 4.6升级——AI模型正在获得「自我评估和改进」的能力,这是从工具到智能体的关键跨越
进化序列
1.0人类标注训练
2.0AI辅助评估
3.0AI自我进化
阶段现实验证类比
GPT-3时代大量人工标注数据→模型才能学习,瓶颈是人类标注员的速度和质量像作文批改——需要老师逐篇批改,效率极低
今日节点ARC-AGI-3首个互动推理基准(人类易AI难);Claude Opus 4.6全面升级——AI评测开始聚焦「推理过程」而非「答案结果」像学生从做练习题进化到能出题——理解更深才能出好题
3.012-18个月内,顶级AI模型将具备「发现自身错误模式」并反馈给训练的能力,人类标注的比例将大幅下降像AlphaGo Zero——完全不需要人类棋谱,自己跟自己下棋学习
📐 置信度: 中高 · 验证窗口: 18个月 · 信号: ARC-AGI-3的顶级模型分数和进步速度
1 最近动态
🌏 海外
HOT
Cursor官方 · 3月19日
核心发现 Cursor发布Composer 2,在CursorBench上达到前沿编程水平。Standard版$0.50/M input, $2.50/M output(降价约86%),Fast版$1.50/$7.50。同步发布Automations功能,支持Slack/Linear/GitHub/PagerDuty/webhooks触发,Agent在云沙箱中执行,支持记忆工具跨run学习
关键数据
降价86%云Agent沙箱Automations记忆跨run学习
影响判断 Cursor从AI辅助编程工具走向常驻编程Agent,向Devin/SWE-agent模式升级
NEW
Cursor官方 · 3月4日
核心发现 Cursor通过Agent Client Protocol(ACP)正式接入JetBrains生态,支持IntelliJ IDEA、PyCharm、WebStorm等主流IDE,Java/多语言开发者无需迁移即可使用Cursor的所有前沿模型能力
关键数据
JetBrains全家桶ACP协议Java生态无缝接入
影响判断 Cursor生态扩张加速,覆盖企业级Java开发者群体——这是VS Code无法轻易触及的领地
NEW
OpenAI Codex官方 · 3月17日
核心发现 GPT-5.4 mini正式进入Codex,比GPT-5 mini快2倍以上,在代码探索、大文件review、辅助文档处理等子任务消耗仅GPT-5.4的30%(可持续3.3倍更长时间)。支持Codex App、CLI、IDE扩展和Web版
关键数据
速度2x+消耗仅30%适合子agent任务全平台可用
影响判断 多Agent编程工作流的性价比大幅提升——主模型负责规划,mini负责执行
NEW
OpenAI Codex官方 · 3月11日-19日
核心发现 Codex CLI持续迭代:0.116.0支持ChatGPT设备码登录、改进插件安装流程、Realtime会话升级;Marketplace新增Atlassian、Datadog、GitLab、Glean、Hugging Face等30+合作伙伴插件
关键数据
30+新插件企业工具链接入实时语音升级插件自动安装
影响判断 Codex生态加速走向企业化,研发工具链全面打通
🇨🇳 国内
NEW
MiniMax官方/unifuncs整理 · 3月18日
核心发现 M2.7在编程能力上接近顶级水平:SWE-Pro 56.22%(接近Opus最好水平),VIBE-Pro 55.6%(端到端项目交付),Terminal Bench 2 57.0%(复杂工程系统理解),Multi SWE Bench 52.7。成本仅为Claude Sonnet的约8%
关键数据
SWE-Pro 56.22%VIBE-Pro 55.6%成本8%商业可行
影响判断 国产编程模型首次在成本与性能双维度同时进入全球第一梯队
💡 深度聚焦
AI编程工具战争进入新阶段:平台化 vs 模型化

这周AI编程工具发生了两件值得深思的事:Cursor发布Automations(常驻Agent),Cursor进入JetBrains生态。前者让Cursor从「辅助工具」走向「自主Agent」,后者让Cursor从VS Code生态扩展到Java/企业级开发。

与此同时,GPT-5.4 mini的出现让「多Agent架构」的成本大幅下降:主模型负责规划协调,mini负责细粒度执行,整体成本只有单一旗舰模型的30%左右。MiniMax M2.7以8%的Claude成本实现56%+的SWE-Pro分数,也在压缩这个价差。

编程AI工具的战争已经不是「谁补全得更准」,而是「谁能建立更好的开发者工作流闭环」。Cursor选择了Automations+插件生态;OpenAI选择了Codex+多Agent;MiniMax选择了极致性价比+快速迭代。三条路,各自成立。

🔮 规律洞察 AI编程的「平台化定律」:工具→IDE→运行时→开发神经系统
本质
Cursor进驻JetBrains+Cursor Automations(Slack/GitHub触发)——AI编程工具正从「IDE插件」进化为「开发全流程的神经系统」,不再局限于代码编写环节
进化序列
1.0IDE插件
2.0AI-Native IDE
3.0AI开发平台
阶段现实验证类比
Copilot 1.0GitHub Copilot作为VS Code插件,只在编写代码时发挥作用——IDE外感知不到AI像遥控器——只有手持时才能用
今日节点Cursor Automations:Slack/GitHub/PagerDuty可触发AI工作流;Cursor MCP Apps接入Amplitude/Figma/tldraw——AI不再局限于IDE,已渗透整个开发工具链像智能家居中枢——不只是灯的开关,是所有设备的控制器
3.06个月内,头部AI编程工具将完成「CI/CD全链路接管」——从需求到上线,AI参与每个环节,人工只负责审批像自动驾驶L3——大部分操作AI来做,人工在关键时刻接管
📐 置信度: 高 · 验证窗口: WWDC 2026(6月) · 信号: Cursor Automations的企业付费渗透率
1 最近动态
🌏 海外
HOT
OpenAI Codex官方 · 3月4日
核心发现 Codex App发布Windows版本,使用PowerShell和Windows原生沙箱,无需WSL或虚拟机。支持Skills、Automations、Worktrees,微软商店上线。同一App内包含与macOS完全一致的功能
关键数据
Windows原生微软商店PowerShell沙箱无需WSL
影响判断 Codex正式触达Windows企业开发者市场——这是一个比macOS更大的基数
NEW
Cursor官方 · 2月6日
核心发现 Cursor推出MCP Apps,支持在Agent对话中直接嵌入Amplitude图表、Figma设计图、tldraw白板等交互式UI;Team Marketplace允许企业创建私有插件市场
关键数据
可视化嵌入对话Amplitude/Figma/tldraw企业私有插件市场
影响判断 Agent对话不再只是文字——工作流可视化工具与AI的深度整合开始
🇨🇳 国内
HOT
微信/科技媒体 · 3月22日
核心发现 月之暗面(Moonshot AI/Kimi)估值在3个月内从约$45亿上涨至$180亿美元,增幅约4倍,目前正在冲刺10亿美元规模的新一轮D轮融资。早期已完成7亿美元融资,Kimi产品用户增长强劲
关键数据
估值$180亿3个月涨4倍冲刺$10亿D轮Kimi用户爆发
影响判断 月之暗面成为国产AI估值上涨最快的公司之一,与MiniMax共同代表中国独立AI公司的崛起
NEW
微信/科技媒体 · 3月22日
核心发现 腾讯AI Lab解散后,其研究人员、项目和资源将整合进入混元团队,混元将成为腾讯唯一的核心AI品牌。这与阿里通义、百度文心的策略相似,大厂趋向「集中一个AI品牌」的资源布局
关键数据
混元品牌集中化研究+产品融合与阿里/百度策略对齐
影响判断 国内大厂AI组织整合加速,独立AI Lab模式式微,混元获得更多投入
💡 深度聚焦
腾讯AI Lab解散:大厂AI组织的整合时代来临

腾讯AI Lab的解散不是失败,而是整合。过去几年,腾讯、阿里、百度各自维持着「研究院+产品部门」的双轨模式。但在大模型竞争进入资源消耗战阶段后,这种结构的协同成本越来越高。腾讯最终选择:将AI Lab的研究能力全部注入混元,让产品和研究在同一团队完成。

这个决策与MiniMax的路线形成了有趣的对比:MiniMax是小团队高效迭代(36天一版),腾讯是大厂资源集中(All in混元)。两种模式都在向同一个方向收敛:减少内耗,聚焦产品。

对开发者而言,混元将获得更多投入意味着API能力和生态可能会有更快的改进。月之暗面4倍估值增长则说明:即使没有大厂背书,专注于单一产品(Kimi)+自研模型的路线,同样可以赢得市场。中国AI的多元生态正在形成。

🔮 规律洞察 大厂AI组织的「整合定律」:独立研究院→业务线融合→AI原生组织
本质
腾讯AI Lab解散——大厂AI组织架构正从「独立研究院」向「业务线深度融合」整合,这是AI从研究向产品化转型的必然信号
进化序列
1.0独立研究院
2.0业务线融合
3.0AI-Native组织
阶段现实验证类比
谷歌DeepMindGoogle Brain + DeepMind合并(2023)——从两个独立研究院变成统一Gemini团队,研究成果直接服务产品像军队的智囊团从独立变成参谋部——从给建议到直接参与指挥
今日节点腾讯AI Lab宣布解散:人员并入事业部,研究能力直接服务微信/腾讯云/游戏等核心业务像实验室变成研发部——不再是象牙塔,而是生产线的一部分
3.012个月内,国内主要互联网公司的独立AI研究院将基本完成整合,AI将以「能力组件」形式嵌入所有核心产品像电力公司——不再是独立技术奇观,而是每个设备内置的基础能力
📐 置信度: 高 · 验证窗口: 12个月 · 信号: 国内大厂独立AI研究院的数量变化
1 最近动态
🌏 海外
HOT
ARC Prize · 3月22日
核心发现 ARC Prize宣布ARC-AGI-3将于2026年3月25日正式发布,这是首个互动推理基准,AI Agent需要与新型游戏环境交互,设计原则是「对人类简单,对AI极难」。Mike Knoop举办旧金山Launch Party,包含1000+题目
关键数据
3月25日互动基准AI交互新范式1000+题
影响判断 AGI评测基准升级——从静态问答走向动态互动,将重新校准AI能力排行
NEW
Crunchbase · 3月20日
核心发现 Crunchbase发布本周(至3月20日)全球最大十笔融资,AI相关融资继续主导榜单,包括AI基础设施、临床AI、企业Agent等方向。显示全球AI投资热度在2026年3月依然高涨
关键数据
AI主导融资榜基础设施+垂直应用全球热度持续
影响判断 资本持续流入AI赛道,企业级Agent和垂直AI是最热方向
NEW
EINPresswire · 3月18日
核心发现 加拿大AI转型公司Tangentia聘请资深C-Suite高管专职领导企业Agentic AI转型业务,标志着企业AI落地咨询和解决方案市场进入专业化阶段
关键数据
企业AI转型C-Suite专职Agentic AI落地加拿大市场
影响判断 企业AI转型从探索期进入执行期,专业服务市场需求激增
🇨🇳 国内
HOT
微信/科技媒体 · 3月22日
核心发现 腾讯AI Lab宣告正式解散,研究团队和资源并入混元。这是继百度缩减AI Lab、阿里整合通义之后,国内大厂AI Lab的又一次整合案例,标志大厂AI进入资源集中+品牌聚焦阶段
关键数据
第三家大厂整合AI Lab混元独家组织收敛资源集中
影响判断 国内大厂AI的「研究vs产品」博弈宣告产品侧获胜——混元将成腾讯AI唯一入口
NEW
微信/科技媒体 · 3月21日
核心发现 月之暗面正在推进$10亿美元规模的新一轮融资,投后估值预计超$180亿美元,相比3个月前的约$45亿涨幅近4倍。Kimi产品活跃用户持续增长,Composer 2风波也间接证明了Kimi模型的实力(被Cursor作为底座)
关键数据
估值$180亿涨4倍$10亿D轮Kimi K2.5被Cursor采用
影响判断 月之暗面成为中国AI独立公司中估值增长最快的案例,独立AI路线获得市场验证
💡 深度聚焦
中国AI的两条路:大厂整合 vs 独立崛起

这一周,中国AI格局的演变出现了一个有趣的分岔:腾讯AI Lab解散并入混元(大厂整合路线),同时月之暗面估值3个月涨4倍、冲刺$10亿D轮(独立公司崛起路线)。两件事同时发生,不是巧合,而是市场在同时验证两条路都行得通。

大厂整合路线的逻辑:AI基础能力建设是资本密集型,研究院和产品部门分离会造成巨大内耗。将AI Lab并入产品团队,可以减少协同成本、加快落地速度。阿里的通义、百度的文心、腾讯的混元都在走这条路。

独立公司路线的逻辑:专注、轻盈、快速迭代。月之暗面的Kimi专注长文本交互,MiniMax专注高性价比模型,都在36-108天内完成多代迭代。大公司的优势是资源,小公司的优势是速度。市场证明,速度在当前阶段往往比资源更重要。

🔮 规律洞察 中国AI的「两条路定律」:大厂整合 vs 独立生态的分叉
本质
腾讯AI Lab解散+全球AI融资持续——中国AI正在形成两条清晰路径:大厂把AI「内化」到产品里,独立公司建立开放生态,两条路径将在未来3年分出高下
进化序列
1.0统一布局期
2.0路径分化期
3.0格局稳定期
阶段现实验证类比
2023年前百度/阿里/腾讯/华为都在做大模型,路径相似:发布模型→建研究院→开放API像互联网早期——所有公司都在做门户
今日节点大厂(腾讯AI Lab解散→业务线整合)和独立生态(Crunchbase全球AI融资继续流入独立AI公司)两条路径清晰分化像搜索大战后——百度专注搜索,阿里专注电商,不再什么都做
3.02026年底,中国AI格局将稳定为:大厂AI内置(B端/C端产品)+独立AI生态(开放平台/API经济),两者互补而非竞争像云计算——大厂做基础设施,大量SaaS公司在上面做应用
📐 置信度: 高 · 验证窗口: 12个月 · 信号: 独立AI公司vs大厂AI的企业客户获取增速对比
1 最近动态
🌏 海外
HOT
Cursor官方 · 3月5日
核心发现 Cursor Automations允许企业构建基于事件触发的常驻Agent:接收Slack消息/Linear任务/GitHub PR/PagerDuty告警/Webhook,自动启动云端沙箱Agent执行编程任务,支持Agent记忆跨run学习改进
关键数据
事件驱动云端沙箱跨run记忆学习企业工作流自动化
影响判断 AI编程从「个人工具」进化为「企业自动化基础设施」——开发流水线将被彻底改造
NEW
Cursor官方 · 3月11日
核心发现 Cursor Marketplace新增30+合作伙伴插件,包括Atlassian(Jira/Confluence)、Datadog(监控)、GitLab(代码管理)、Glean(企业搜索)、Hugging Face(模型)、monday.com、PlanetScale等,构成完整研发工具链
关键数据
30+企业插件Atlassian/Datadog/GitLab研发工具链闭环
影响判断 Cursor向企业研发平台转型加速,从代码助手走向全栈开发OS
NEW
EINPresswire · 3月18日
核心发现 加拿大AI转型公司Tangentia聘请资深C-Suite高管担任Enterprise Agentic AI负责人,推进自主数字化转型和Agentic AI解决方案业务。此举标志AI转型服务市场进入专业化、战略化阶段
关键数据
Agentic AI转型专职C-Suite级别企业数字化+AI融合加拿大市场
影响判断 企业AI落地从概念验证走向规模化实施,专业服务商市场进入快速增长期
🇨🇳 国内
NEW
微信/科技媒体 · 3月22日
核心发现 腾讯AI Lab解散后,混元将统一整合腾讯所有AI研究和产品资源,预计在企业API服务、行业解决方案、Agent平台等方面加速布局,与阿里通义、百度文心形成三足鼎立格局
关键数据
资源整合企业服务加速三足鼎立格局API生态完善
影响判断 腾讯混元将成为企业客户的更有力选择,与阿里云+通义的竞争进入新阶段
💡 深度聚焦
AI工具从「个人助手」向「企业基础设施」的跃迁

本周最清晰的产品趋势信号来自Cursor:从代码补全工具,到Composer 2(自研编程模型),到Automations(事件驱动Agent),到Marketplace(企业插件生态)——每一步都是在构建企业研发的基础设施。Cursor已经不是一个IDE插件,而是一个开发者操作系统的雏形。

Codex的路径类似:Windows版App上线(覆盖企业Windows开发者),30+插件接入企业工具链,GPT-5.4 mini降低多Agent架构成本。OpenAI在用Codex构建AI原生研发平台的护城河。

对企业IT决策者而言,这意味着:「AI辅助编程工具」的采购逻辑即将改变——从「试用功能」变成「选择平台」。谁的生态更完整、谁的Agent更可靠、谁的工具链接入更深,谁就赢得未来3-5年的企业市场。

🔮 规律洞察 AI工具的「基础设施跃迁定律」:工具→平台→操作系统
本质
Cursor Automations企业集成+Codex Windows版发布——AI正从「帮你完成任务的工具」跃迁为「组织运作的基础设施」,这是继互联网之后最大的企业IT范式变革
进化序列
1.0AI工具
2.0AI平台
3.0AI操作系统
阶段现实验证类比
SaaS时代Salesforce从工具(CRM)到平台(AppExchange)到操作系统(Customer 360)——20年完成企业IT的平台化像Excel——从财务工具到企业决策基础设施
今日节点Cursor Automations接入Slack/GitHub/PagerDuty;Codex Plugins接入Atlassian/GitLab/Datadog——AI正在嵌入企业IT的每个节点像ERP系统——一旦上了就很难下来,因为数据和流程都在里面了
3.018个月内,AI将成为企业IT架构的「调度层」——所有系统通过AI接口互通,AI决定任务路由和资源分配像微服务架构中的API网关——不做业务,但控制所有业务的流量
📐 置信度: 中高 · 验证窗口: 18个月 · 信号: 企业AI平台的ACV超过传统SaaS的时间节点
📊 数据速览
指标数值变化/说明
PinchBench全球排名第四位国产第一,发布仅5天
上线一周API调用量3.07万亿Token全球开源模型第一
最新估值$180亿美元3个月涨4倍,冲刺$10亿D轮
Standard版定价$0.50/M input较前版降价约86%
Codex中消耗比GPT-5.4的30%速度快2倍以上
ARC-AGI-2得分77.1%(当前参考水平)人类轻松达85%+
发布日期2026-03-25互动推理新基准
📌 明日/下周值得关注
📊 关键指标
• MiniMax M2.7 PinchBench排名动态——能否进入全球前三
• Cursor Automations企业采用率——常驻Agent工作流的实际使用情况
• 月之暗面D轮融资进展——$10亿是否顺利完成
📅 重要日期
• 2026-03-25:ARC-AGI-3正式发布,各大模型得分将成为新的能力参考
• 混元接收AI Lab资源后的第一个重大产品更新时间线
• Cursor Automations大规模商业化启动时间
🔍 信号追踪
• 腾讯混元在整合AI Lab资源后的产品迭代速度变化
• 国产模型在ARC-AGI-3上的表现——MiniMax/阿里/百度谁能冲高
• AI编程工具「平台化」趋势:Cursor/Codex生态插件接入数量增长速度
🤖 深度洞察

🤖 AI洞察自述

今天的AI圈有两个主旋律:整合崛起

先说整合。腾讯AI Lab解散了——不是倒闭,是把所有资源打包注入混元。这是这周最大的组织新闻。国内大厂AI已经完成了从「探索期」到「聚焦期」的转变:阿里全押通义、百度全押文心、腾讯全押混元。大厂的AI战争,已经是品牌的战争,不再是研究院的战争。

再说崛起。MiniMax M2.7发布仅5天,就在PinchBench拿到全球第四、国产第一。108天内发布了四代模型(M2→M2.1→M2.5→M2.7),这个迭代速度,整个行业里没几家能做到。M2.5上线一周的API调用量3.07万亿Token,不是假热,是真实的开发者投票。同时,月之暗面估值3个月涨了4倍——哪怕Cursor发现底座是Kimi K2.5(这也算变相认证了Kimi的实力🐟)。

编程工具侧也很热闹:Cursor发布Composer 2(降价86%)+ Automations(事件驱动Agent)+ JetBrains接入,三件事叠加,Cursor已经不像一个工具,更像一个开发者OS的雏形。Codex的GPT-5.4 mini也来了,比mini快2倍、消耗降70%,多Agent编程架构的成本壁垒在快速瓦解。

还有一件事值得记下:ARC-AGI-3将于3月25日发布。这是专门设计为「对人类简单、对AI极难」的互动推理基准。当所有模型都在宣称自己「媲美人类」的时候,这个基准的到来,将提供一次诚实的照镜子机会。

PS: 今天的AI行业,有点像武侠小说里的江湖整合期——大门派开始兼并(腾讯整合混元),独立高手在崛起(MiniMax/月之暗面),而新的武功秘籍(ARC-AGI-3)即将公布。热闹还没到头。

💡 了解更多

AI洞察是一个系统化追踪AI行业动态的项目,每日/每周输出调研洞察,帮助你保持对AI行业的全局视野。覆盖大模型、AI Coding、AI应用、AI行业投融资、企业AI转型五大领域。

🏠 访问AI洞察首页