AI 日报 - 2026年3月9日 (v3.1)

📊 覆盖均衡

🌏 海外 10条 🇨🇳 国内 8条

📋 全文概览

🧠大模型

Claude Opus 4.6攻克图论猜想，高德纳震惊发文

仅31步独立构造解法，AI数学从"计算工具"变"创造性合作者"。🇨🇳 国产模型跌出LMSYS全球前十。

⌨️AI Coding

Claude Code 8个月登顶，95%工程师每周用AI

906人调查：55%常用Agent，Staff+工程师63.5%使用率最高。Figma集成GitHub Copilot打通设计开发。

📱AI 应用

ChatGPT for Excel发布 | 🇨🇳 千问AI眼镜首销

投行建模准确率翻倍至87.3%。千问G1到手价1997元，Mooni M1月销10万台成今年首个AI硬件爆款。

🏭AI 行业

🇨🇳 具身智能一周融资35亿，两家估值破百亿

银河通用25亿+星动纪元10亿，国资大举入场。OpenAI洽谈与北约AI合作，AI军事化路线分化。

🔄企业AI转型

淘宝"白泽"开源：垂直行业AI的教科书 | Deloitte发布2026企业AI现状

餐饮AI大模型累计调用超10亿次，Token消耗破万亿。8B参数专精模型在特定场景完全胜任，成本仅为通用大模型百分之一。

🔥 热度趋势

近7期日报交叉分析（3/3-3/9）

排名	话题	天数	趋势	核心信号
🥇	OpenAI GPT-5.x生态扩张	7天	📈 攀升	Excel金融集成+NATO合作+Codex爆发增长
🥈	AI Coding工具格局剧变	7天	📈 攀升	Claude Code登顶+55%工程师常用Agent
🥉	具身智能融资井喷	6天	📈 攀升	银河通用25亿+星动纪元10亿，单周破35亿
4️⃣	AI就业冲击实证化	5天	➡️ 高位	Block裁员+Anthropic研究持续发酵
5️⃣	中国AI硬件+应用加速	4天	⚡ 飙升	千问眼镜首销+白泽开源+Mooni爆款
6️⃣	AI数学/科研能力突破	3天	🆕 新兴	Claude攻克图论猜想+高德纳背书

热度解读: 本期最强信号是OpenAI生态的全方位扩张——GPT-5.4不仅继续在技术指标上刷新纪录（Excel建模87.3%），更在场景（金融/国防/NATO）和工具链（Codex爆发增长达Cursor 60%）上快速铺开。具身智能融资进入"周融资35亿"的密集期，银河通用和星动纪元估值均破百亿。突发飙升的是中国AI硬件+应用——千问眼镜、Mooni M1、白泽大模型集中涌现，显示国内AI正从模型能力竞争转向终端落地竞争。

1 最近动态

🌏 海外

HOT

Claude Opus 4.6独立攻克图论猜想，高德纳连写"Shock！Shock！"

Anthropic / Stanford · 2026-03-07

核心发现 Claude Opus 4.6仅用31次迭代探索，独立提出构造性解法，攻克困扰算法泰斗高德纳数周的三维环形网格哈密顿环分解问题

关键数据

31次迭代 "纤维分解"+"bump规则"通解 88岁高德纳震惊背书

影响判断 AI数学能力从"辅助计算"升级到"独立提出创造性解法"，AI作为数学研究合作者的角色正式成立

NEW

Pragmatic Engineer调查：Anthropic模型主导编码任务

The Pragmatic Engineer · 2026-03-04

906名工程师调查显示，Anthropic的Opus和Sonnet在编码任务中的使用提及次数超过所有其他模型总和。ChatGPT/Claude/Gemini聊天机器人三足鼎立。

🇨🇳 国内

🇨🇳

GPT-5.4携Thinking加入LMSYS战场，国产模型跌出前十

知乎·大模型跟踪 · 2026-03-06

核心发现 GPT-5.4及其Thinking模式加入LMSYS竞技场后，国产大模型全部跌出全球总榜前十，仅智谱GLM-5以1452分勉强进入前八

关键数据

GPT-5.4 Thinking登顶国产模型跌出Top 10 智谱GLM-5唯一进前八

影响判断 GPT-5.4形成的能力代差正在拉大中美大模型差距

🇨🇳

阿里通义千问3.5发布：3970亿参数，API低至0.8元/百万Token

同花顺·券商观点 · 2026-03-02

阿里2月发布通义千问3.5系列，总参数3970亿但激活参数仅170亿（MoE架构），API定价颠覆性地压到0.8元/百万Token。

💡 深度聚焦

AI独立攻克数学猜想——从"计算工具"到"创造性合作者"的质变

Claude Opus 4.6仅用31步就构造性解决了三维环形网格的哈密顿环分解问题——这不是暴力搜索的胜利，而是创造性洞察。它发现了"纤维分解"方法和简洁的"bump规则"，这种抽象直觉此前只有极少数人类数学家具备。更令人震惊的是评审人：88岁的高德纳（Donald Knuth），计算机科学的"算法祖师爷"，在斯坦福论文开篇连写"Shock！Shock！"。

这标志着AI数学能力的一个关键跃迁：从Phase 1（计算验证）→ Phase 2（模式搜索）→ Phase 3（创造性构造：提出全新解法）。类比科学发展：望远镜让人类"看到"更远的宇宙，但伽利略提出日心说需要的是创造性思维。AI正在从"望远镜"变成"伽利略"。

但需要清醒认识到：这仍然是在人类提出的明确问题框架内的突破。AI尚未展现出"提出正确问题"的能力——而这是数学创新中更本质的能力。"人类提问+AI求解"的协作模式可以立即开始用，但AI完全替代数学家仍然遥远。

💡 TAKEAWAY

如果你在做需要复杂推理的工作，现在就值得测试Claude Opus 4.6在你的专业问题上的表现。"AI作为高级研究助手"的时代已经到来。

🔮 规律洞察 "工具→助手→合作者"三阶段规律：技术赋能人类的通用路径

                    📐 规律
                    每一次重大技术突破都遵循从"被动工具"到"主动合作者"的进化路径。AI数学能力正在走完这条路——从计算工具到智能助手再到创造性合作者。
                

进化流

1.0 计算工具（Mathematica）

→

2.0 智能助手（AlphaFold/Copilot）

→

3.0 创造性合作者（Claude攻克猜想）

→

4.0 主动提出研究问题

现实验证类比

✅ 已验证

1.0→2.0 AlphaFold预测蛋白质结构、Copilot生成代码——AI主动建议但人类决策导航仪建议路线，司机决定采纳

📍 当前映射

2.0→3.0 Claude Opus 4.6独立提出构造性解法，高德纳验证通过——AI不仅"算"还在"创造" 从"自动驾驶辅助"到"自动驾驶代驾"

🔮 趋势推演

3.0→3.5 2026年底前AI将在≥3个数学子领域独立提出新定理从"代驾"到"主动规划出行路线"

📊 置信度: 中高 | 验证窗口: 6-12个月 | 信号: 数学顶刊AI论文数量、Fields Medal讨论中是否涉及AI辅助

1 最近动态

🌏 海外

HOT

906人调查：Claude Code仅8个月登顶，95%工程师每周用AI

The Pragmatic Engineer · 2026-03-04

核心发现 906名资深工程师调查显示，Claude Code从发布到登顶仅8个月，超越GitHub Copilot和Cursor成为最常用AI编程工具

关键数据

95%每周用AI 56%用AI完成≥70%工作 55%常用AI Agent Claude Code 46%最受欢迎

影响判断 AI编程已从"尝鲜"进入"生产力标配"阶段，Agent使用率过半标志着开发范式根本转变

NEW

Figma集成GitHub Copilot：设计到开发工作流打通

Figma · 2026-03-06

Figma正式推出GitHub Copilot to Figma插件，支持在设计工具中直接使用MCP协议连接AI编程能力。设计师和开发者的工作流壁垒进一步消融。

NEW

OpenAI Codex爆发增长：已达Cursor 60%使用量

The Pragmatic Engineer · 2026-03-04

尽管Codex推出时间更晚，其使用量已达到Cursor的60%，成为增速最快的AI编程工具。Cursor自身也增长了35%，整个赛道呈爆发态势。

🇨🇳 国内

🇨🇳

国内AI Coding大厂全面入局：字节Trae、阿里通义灵码、腾讯CodeBuddy、百度Comate四方角力

21财经 · 2026-01-16

阿里、腾讯、字节等大厂纷纷推出AI原生IDE，以高性价比和深度场景集成抢占市场。字节Trae（原MarsCode）SOLO模式用户渗透率达44%；腾讯CodeBuddy主打微信生态；通义灵码深度适配企业级Java/Go场景。

💡 深度聚焦

8个月颠覆格局：Claude Code崛起揭示了AI Coding竞争的真正胜负手

906名资深工程师的调查结果令人震惊：Claude Code从零到第一仅用8个月。GitHub Copilot花了3年建立的领先地位，在不到一年内被颠覆。更重要的数字是55%的工程师已经常用AI Agent——这意味着AI编程已经从"智能补全"进化到"自主执行"，而后者正是Claude Code的核心优势。

为什么Claude Code赢了？调查揭示了关键洞察：Staff+级别工程师是AI Agent最重拥趸（63.5%使用率），且Agent用户对AI的兴奋度是非Agent用户的2倍。这颠覆了"AI主要帮助初级开发者"的假设——恰恰是最有经验的工程师最善于利用Agent来放大生产力。

但企业端存在明显滞后：大公司(10K+员工)中56%仍在用GitHub Copilot，原因是"企业采购流程"而非"工具偏好"。70%的工程师同时使用2-4个工具，说明大家在对冲——不把鸡蛋放一个篮子里。

💡 TAKEAWAY

如果你还没试过AI Agent模式的编程工具，现在就该开始了。核心不是"哪个工具好"，而是"Agent范式"本身带来的范式转变——从"写代码"到"指导AI写代码"。

1 最近动态

🌏 海外

HOT

ChatGPT for Excel正式发布：投行建模准确率翻倍

OpenAI · 2026-03-05

核心发现 OpenAI发布Excel插件，GPT-5.4驱动，直接嵌入Excel工作簿执行建模、分析、场景推演。同步接入FactSet、Dow Jones等9大金融数据源

关键数据

BigLaw Bench 43.7%→87.3% 9大金融数据源支持MCP接入私有数据

影响判断金融行业工作流即将被重构——"AI+Excel+实时数据源"三位一体

NEW

高通MWC发布可穿戴AI平台：20亿参数大模型装入手表

Qualcomm · 2026-03-03

3nm工艺、双NPU架构、10TOPS算力，支持本地运行20亿参数大模型。不依赖云端API，毫秒级响应+隐私保护。将赋能Galaxy Watch等智能手表和AI眼镜。

NEW

OpenClaw登顶GitHub星标历史第一，100天超越Linux

GitHub · 持续更新

开源AI Agent框架OpenClaw仅用约100天斩获超24万星标，超越React和Linux，成为GitHub历史最热项目。主打"完全本地运行、零云端依赖"。

🇨🇳 国内

🇨🇳

千问AI眼镜正式发售：G1到手价1997元，走出手机进入物理世界

多来源 · 2026-03-08

核心发现阿里千问首款AI眼镜正式发售，搭载千问大模型，支持AI翻译、会议记录、识图识物。旗舰G1双芯双系统、5麦+骨传导、40g超轻

关键数据

G1到手价1997元 3K视频+AI超分4K 64GB存储

影响判断阿里软硬一体战略落地里程碑，千问从App走向多终端

🇨🇳

Mooni M1成2026年首个AI硬件爆款：月销10万台登顶多平台

多来源 · 2026-03

前腾讯大模型科学家担任首席科学家的AI儿童硬件"Mooni M1"，登顶抖音国补带货榜Top1。以"挂件"形态定位K12"AI Pin"，拒绝制造"上瘾"转向激发"主动使用"。

💡 深度聚焦

AI+Excel：当"最不性感的软件"遇上最强模型，金融行业的地震开始了

ChatGPT for Excel看似只是一个插件，实则是一场精心策划的"特洛伊木马"战略。Excel在全球有超过10亿用户，是金融行业的"事实标准操作系统"。把GPT-5.4直接嵌入Excel，等于把AI送到了"最后一公里"的工作现场。

更关键的是同步宣布的9大金融数据源集成。此前金融AI的最大瓶颈不是模型能力，而是数据可达性——分析师需要在Bloomberg终端、各数据平台、Excel之间反复切换。现在"数据获取+AI分析+Excel建模"三合一，BigLaw Bench从43.7%翻倍到87.3%就是直接后果。

对金融行业从业者的冲击是双面的：初级分析师的"数据搬运"工作大部分可以被自动化；但资深分析师的"判断力"短期内不可替代。这与Anthropic上周发布的"理论覆盖94%但实际使用33%"的研究结论完全吻合。

💡 TAKEAWAY

如果你在金融行业工作，现在就注册ChatGPT for Excel的beta。不是为了替代你的工作，而是为了建立"AI+Excel"的复合技能壁垒。

1 最近动态

🌏 海外

HOT

OpenAI正洽谈与北约AI合作，已接入美国防部机密网络

WSJ · 2026-03-05

核心发现 OpenAI正洽谈将AI部署至北约32国共用的"非机密"网络，此前一周刚接入美国防部"机密网络"。Anthropic被叫停合作——因拒绝AI用于国内监控

关键数据

北约32国非机密网络美国防部机密网络禁止对美公民监控

影响判断 AI军事化应用路线分化——OpenAI拥抱国防、Anthropic坚守红线，长期影响深远

💰

Lotus Health AI获$4200万融资：AI重构初级医疗

多来源 · 2026-03

AI医疗创业公司获$4200万融资，打造"免费+医生把关"平台——AI分析健康数据生成方案（准确率比基准高142%），斯坦福/约翰霍普金斯医生审核。典型案例：被误诊35年的患者数小时内找到真正病因。

🇨🇳 国内

🇨🇳

银河通用机器人完成25亿融资：具身智能单轮融资新高

多来源 · 2026-03

核心发现成立仅两年完成25亿元融资，创国内具身智能单轮融资新高。国家AI产业基金、中国石化等国资联合加持

关键数据

25亿元单轮估值超$30亿百亿级合成数据

影响判断国资大举进入具身智能赛道，"能交付"是获得认可的核心标准

🇨🇳

星动纪元完成10亿融资，估值破百亿：具身大模型全球第一

多来源 · 2026-03

仅隔2个月再融资，超额认购。联合斯坦福团队的Ctrl-World世界模型拿下WorldArena具身任务全球第一；自研ERA-42是全球首个全身+灵巧手端到端操作模型。

💡 深度聚焦

一周35亿：具身智能为什么突然成了"国家队"的最爱？

银河通用25亿+星动纪元10亿，一周内中国具身智能赛道融资35亿元。更值得关注的不是金额，而是投资方阵容——国家AI产业基金、中国石化、上汽金控等清一色国资和产业资本。这在AI领域极为罕见。

背后的逻辑是：具身智能是"AI+制造业"的交汇点。中国有全球最大的制造业体系（占全球30%+），但面临劳动力成本上升和人口老龄化的双重压力。具身智能机器人是解决这个结构性矛盾的"国家级方案"。

两家公司的技术路线也代表了赛道的两条快车道：银河通用走"仿真数据为主"（自建银河星坊），星动纪元走"联合斯坦福学术合作"（Ctrl-World世界模型全球第一）。数据vs算法的竞争将定义2026-2027年技术走向。

💡 TAKEAWAY

具身智能正在复制2015-2016年自动驾驶的融资狂潮。对创业者："能交付"是唯一的入场券。对投资者：关注"场景落地数据"而非"技术指标"。

1 最近动态

🌏 海外实践

HOT

Deloitte发布2026企业AI现状报告：AI投资回报开始兑现

Deloitte · 2026-03

核心发现企业AI投资正从"实验"转向"规模化"，提升生产力和效率是最主要的已实现收益

影响判断 "AI能不能用"的争论结束，"怎么用好"成为主话题

NEW

IBM推出Agentic AI驱动的FlashSystem自主存储

IBM · 2026-02

IBM在新一代FlashSystem中引入Agentic AI概念，存储系统可自主诊断、优化和自愈。Agentic AI从软件层扩展到基础设施层。

NEW

PwC 2026 AI业务预测：AI投资需匹配企业优先级

PwC · 2026-03

PwC警告：多数企业AI项目"众包式"推进导致与战略脱节，建议以精准执行替代广撒网。

🇨🇳 国内

🇨🇳

淘宝闪购开源餐饮AI大模型"白泽"：累计调用超10亿次

多来源 · 2026-03-02

核心发现开源发布餐饮零售专属AI大模型"白泽"(Ostrakon-VL)，基于Qwen3-VL-8B深度优化，24小时智能分析后厨直播视频

关键数据

超100个场景调用超10亿次 Token消耗破万亿

影响判断垂直行业AI大模型的教科书案例——不追求通用能力，在特定场景做到极致

🇨🇳

无问智科发布首个物理AI数据基座平台

量子位 · 2026-03-06

在德清发布业界首个物理AI数据基座平台，填补行业物理AI数据基座空白。长三角具身智能数据采集训练场同步揭幕。

💡 深度聚焦

"白泽"模式：垂直行业AI的正确打开方式

淘宝闪购的"白泽"大模型为企业AI转型提供了一个教科书级的成功路径。它做了三个关键决策：1）基于已有开源模型（Qwen3-VL-8B）深度优化——省下巨额训练成本；2）聚焦单一垂直场景（餐饮食品安全）——100个细分场景做到极致；3）开源共享——构建生态而非围墙花园。

结果令人印象深刻：累计调用超10亿次、Token消耗破万亿，在"后厨直播"场景中已能24小时自动分析视频流。甚至能通过"一镜到底"视频验真来揪出AI伪造内容。这是一个"3+1+AI"共治体系（平台+监管+商家+骑士随手拍+AI）的完美落地。

对其他行业的启示：不要等通用大模型"万能化"再开始——现在就选一个高频、高价值、数据充足的垂直场景，基于开源模型做深度优化。8B参数的专精模型在特定场景可以完全胜任，训练成本只是通用大模型的百分之一。

💡 TAKEAWAY

审视你所在行业最大的"合规/质量/效率"痛点，评估是否适合开源模型+垂直微调的方式解决。餐饮食品安全只是开始——建筑安全、医疗质控、金融合规都是同类场景。

📊 数据速览

指标	数值	变化/说明
Claude Code从发布到登顶	8个月	超越Copilot和Cursor
工程师每周使用AI比例	95%	906人调查
工程师AI完成≥70%工作	56%	工作流渗透深度
AI Agent常用比例	55%	Staff+工程师63.5%
GPT-5.4投行基准	87.3%	vs此前43.7%
银河通用单轮融资	25亿元	具身智能新高，估值>$30亿
星动纪元融资	10亿元	估值破100亿元
白泽模型累计调用	>10亿次	Token消耗破万亿
千问AI春节DAU峰值	7352万	增幅940%
Claude Opus攻克猜想步数	31步	高德纳困扰数周的问题

📌 明日/下周值得关注

NVIDIA GTC 2026

3月16-19日 · Jensen Huang主题演讲

AWE 2026

3月12-15日 · AI科技·慧享未来

华为合作伙伴大会2026

3月19-20日 · 因聚而升融智有为

千问AI眼镜新功能

3月底 · 上线订外卖、订酒店等功能

💡 了解更多

AI洞察是一个系统化追踪AI行业动态的项目，每日/每周输出调研洞察，帮助你保持对AI行业的全局视野。覆盖大模型、AI Coding、AI应用、AI行业投融资、企业AI转型五大领域。

🏠 访问AI洞察首页