📡 AI行业洞察项目 - AI日报
AI 日报 v3.1
2026年3月9日 星期一 | 五大板块:大模型 · AI Coding · AI应用 · AI行业 · 企业转型
📊 覆盖均衡
🌏 海外 10条 🇨🇳 国内 8条
📋 全文概览
🧠大模型
Claude Opus 4.6攻克图论猜想,高德纳震惊发文
仅31步独立构造解法,AI数学从"计算工具"变"创造性合作者"。🇨🇳 国产模型跌出LMSYS全球前十。
⌨️AI Coding
Claude Code 8个月登顶,95%工程师每周用AI
906人调查:55%常用Agent,Staff+工程师63.5%使用率最高。Figma集成GitHub Copilot打通设计开发。
📱AI 应用
ChatGPT for Excel发布 | 🇨🇳 千问AI眼镜首销
投行建模准确率翻倍至87.3%。千问G1到手价1997元,Mooni M1月销10万台成今年首个AI硬件爆款。
🏭AI 行业
🇨🇳 具身智能一周融资35亿,两家估值破百亿
银河通用25亿+星动纪元10亿,国资大举入场。OpenAI洽谈与北约AI合作,AI军事化路线分化。
🔄企业AI转型
淘宝"白泽"开源:垂直行业AI的教科书 | Deloitte发布2026企业AI现状
餐饮AI大模型累计调用超10亿次,Token消耗破万亿。8B参数专精模型在特定场景完全胜任,成本仅为通用大模型百分之一。
🔥 热度趋势
近7期日报交叉分析(3/3-3/9)
排名 话题 热度 天数 趋势 核心信号
🥇 OpenAI GPT-5.x生态扩张
7天 📈 攀升 Excel金融集成+NATO合作+Codex爆发增长
🥈 AI Coding工具格局剧变
7天 📈 攀升 Claude Code登顶+55%工程师常用Agent
🥉 具身智能融资井喷
6天 📈 攀升 银河通用25亿+星动纪元10亿,单周破35亿
4️⃣ AI就业冲击实证化
5天 ➡️ 高位 Block裁员+Anthropic研究持续发酵
5️⃣ 中国AI硬件+应用加速
4天 ⚡ 飙升 千问眼镜首销+白泽开源+Mooni爆款
6️⃣ AI数学/科研能力突破
3天 🆕 新兴 Claude攻克图论猜想+高德纳背书

热度解读: 本期最强信号是OpenAI生态的全方位扩张——GPT-5.4不仅继续在技术指标上刷新纪录(Excel建模87.3%),更在场景(金融/国防/NATO)和工具链(Codex爆发增长达Cursor 60%)上快速铺开。具身智能融资进入"周融资35亿"的密集期,银河通用和星动纪元估值均破百亿。突发飙升的是中国AI硬件+应用——千问眼镜、Mooni M1、白泽大模型集中涌现,显示国内AI正从模型能力竞争转向终端落地竞争。

1 最近动态
🌏 海外
HOT
Anthropic / Stanford · 2026-03-07
核心发现 Claude Opus 4.6仅用31次迭代探索,独立提出构造性解法,攻克困扰算法泰斗高德纳数周的三维环形网格哈密顿环分解问题
关键数据
31次迭代 "纤维分解"+"bump规则"通解 88岁高德纳震惊背书
影响判断 AI数学能力从"辅助计算"升级到"独立提出创造性解法",AI作为数学研究合作者的角色正式成立
NEW
The Pragmatic Engineer · 2026-03-04
906名工程师调查显示,Anthropic的Opus和Sonnet在编码任务中的使用提及次数超过所有其他模型总和。ChatGPT/Claude/Gemini聊天机器人三足鼎立。
🇨🇳 国内
🇨🇳
知乎·大模型跟踪 · 2026-03-06
核心发现 GPT-5.4及其Thinking模式加入LMSYS竞技场后,国产大模型全部跌出全球总榜前十,仅智谱GLM-5以1452分勉强进入前八
关键数据
GPT-5.4 Thinking登顶 国产模型跌出Top 10 智谱GLM-5唯一进前八
影响判断 GPT-5.4形成的能力代差正在拉大中美大模型差距
🇨🇳
同花顺·券商观点 · 2026-03-02
阿里2月发布通义千问3.5系列,总参数3970亿但激活参数仅170亿(MoE架构),API定价颠覆性地压到0.8元/百万Token。
💡 深度聚焦
AI独立攻克数学猜想——从"计算工具"到"创造性合作者"的质变

Claude Opus 4.6仅用31步就构造性解决了三维环形网格的哈密顿环分解问题——这不是暴力搜索的胜利,而是创造性洞察。它发现了"纤维分解"方法和简洁的"bump规则",这种抽象直觉此前只有极少数人类数学家具备。更令人震惊的是评审人:88岁的高德纳(Donald Knuth),计算机科学的"算法祖师爷",在斯坦福论文开篇连写"Shock!Shock!"。

这标志着AI数学能力的一个关键跃迁:从Phase 1(计算验证)→ Phase 2(模式搜索)→ Phase 3(创造性构造:提出全新解法)。类比科学发展:望远镜让人类"看到"更远的宇宙,但伽利略提出日心说需要的是创造性思维。AI正在从"望远镜"变成"伽利略"。

但需要清醒认识到:这仍然是在人类提出的明确问题框架内的突破。AI尚未展现出"提出正确问题"的能力——而这是数学创新中更本质的能力。"人类提问+AI求解"的协作模式可以立即开始用,但AI完全替代数学家仍然遥远。

💡 TAKEAWAY
如果你在做需要复杂推理的工作,现在就值得测试Claude Opus 4.6在你的专业问题上的表现。"AI作为高级研究助手"的时代已经到来。
🔮 规律洞察 "工具→助手→合作者"三阶段规律:技术赋能人类的通用路径
📐 规律 每一次重大技术突破都遵循从"被动工具"到"主动合作者"的进化路径。AI数学能力正在走完这条路——从计算工具智能助手再到创造性合作者
进化流
1.0 计算工具(Mathematica)
2.0 智能助手(AlphaFold/Copilot)
3.0 创造性合作者(Claude攻克猜想)
4.0 主动提出研究问题
现实验证 类比
1.0→2.0 AlphaFold预测蛋白质结构、Copilot生成代码——AI主动建议但人类决策 导航仪建议路线,司机决定采纳
2.0→3.0 Claude Opus 4.6独立提出构造性解法,高德纳验证通过——AI不仅"算"还在"创造" 从"自动驾驶辅助"到"自动驾驶代驾"
3.0→3.5 2026年底前AI将在≥3个数学子领域独立提出新定理 从"代驾"到"主动规划出行路线"
📊 置信度: 中高 | 验证窗口: 6-12个月 | 信号: 数学顶刊AI论文数量、Fields Medal讨论中是否涉及AI辅助
1 最近动态
🌏 海外
HOT
The Pragmatic Engineer · 2026-03-04
核心发现 906名资深工程师调查显示,Claude Code从发布到登顶仅8个月,超越GitHub Copilot和Cursor成为最常用AI编程工具
关键数据
95%每周用AI 56%用AI完成≥70%工作 55%常用AI Agent Claude Code 46%最受欢迎
影响判断 AI编程已从"尝鲜"进入"生产力标配"阶段,Agent使用率过半标志着开发范式根本转变
NEW
Figma · 2026-03-06
Figma正式推出GitHub Copilot to Figma插件,支持在设计工具中直接使用MCP协议连接AI编程能力。设计师和开发者的工作流壁垒进一步消融。
NEW
The Pragmatic Engineer · 2026-03-04
尽管Codex推出时间更晚,其使用量已达到Cursor的60%,成为增速最快的AI编程工具。Cursor自身也增长了35%,整个赛道呈爆发态势。
🇨🇳 国内
🇨🇳
21财经 · 2026-01-16
阿里、腾讯、字节等大厂纷纷推出AI原生IDE,以高性价比和深度场景集成抢占市场。字节Trae(原MarsCode)SOLO模式用户渗透率达44%;腾讯CodeBuddy主打微信生态;通义灵码深度适配企业级Java/Go场景。
💡 深度聚焦
8个月颠覆格局:Claude Code崛起揭示了AI Coding竞争的真正胜负手

906名资深工程师的调查结果令人震惊:Claude Code从零到第一仅用8个月。GitHub Copilot花了3年建立的领先地位,在不到一年内被颠覆。更重要的数字是55%的工程师已经常用AI Agent——这意味着AI编程已经从"智能补全"进化到"自主执行",而后者正是Claude Code的核心优势。

为什么Claude Code赢了?调查揭示了关键洞察:Staff+级别工程师是AI Agent最重拥趸(63.5%使用率),且Agent用户对AI的兴奋度是非Agent用户的2倍。这颠覆了"AI主要帮助初级开发者"的假设——恰恰是最有经验的工程师最善于利用Agent来放大生产力。

但企业端存在明显滞后:大公司(10K+员工)中56%仍在用GitHub Copilot,原因是"企业采购流程"而非"工具偏好"。70%的工程师同时使用2-4个工具,说明大家在对冲——不把鸡蛋放一个篮子里。

💡 TAKEAWAY
如果你还没试过AI Agent模式的编程工具,现在就该开始了。核心不是"哪个工具好",而是"Agent范式"本身带来的范式转变——从"写代码"到"指导AI写代码"。
1 最近动态
🌏 海外
HOT
OpenAI · 2026-03-05
核心发现 OpenAI发布Excel插件,GPT-5.4驱动,直接嵌入Excel工作簿执行建模、分析、场景推演。同步接入FactSet、Dow Jones等9大金融数据源
关键数据
BigLaw Bench 43.7%→87.3% 9大金融数据源 支持MCP接入私有数据
影响判断 金融行业工作流即将被重构——"AI+Excel+实时数据源"三位一体
NEW
Qualcomm · 2026-03-03
3nm工艺、双NPU架构、10TOPS算力,支持本地运行20亿参数大模型。不依赖云端API,毫秒级响应+隐私保护。将赋能Galaxy Watch等智能手表和AI眼镜。
NEW
GitHub · 持续更新
开源AI Agent框架OpenClaw仅用约100天斩获超24万星标,超越React和Linux,成为GitHub历史最热项目。主打"完全本地运行、零云端依赖"。
🇨🇳 国内
🇨🇳
多来源 · 2026-03-08
核心发现 阿里千问首款AI眼镜正式发售,搭载千问大模型,支持AI翻译、会议记录、识图识物。旗舰G1双芯双系统、5麦+骨传导、40g超轻
关键数据
G1到手价1997元 3K视频+AI超分4K 64GB存储
影响判断 阿里软硬一体战略落地里程碑,千问从App走向多终端
🇨🇳
多来源 · 2026-03
前腾讯大模型科学家担任首席科学家的AI儿童硬件"Mooni M1",登顶抖音国补带货榜Top1。以"挂件"形态定位K12"AI Pin",拒绝制造"上瘾"转向激发"主动使用"。
💡 深度聚焦
AI+Excel:当"最不性感的软件"遇上最强模型,金融行业的地震开始了

ChatGPT for Excel看似只是一个插件,实则是一场精心策划的"特洛伊木马"战略。Excel在全球有超过10亿用户,是金融行业的"事实标准操作系统"。把GPT-5.4直接嵌入Excel,等于把AI送到了"最后一公里"的工作现场

更关键的是同步宣布的9大金融数据源集成。此前金融AI的最大瓶颈不是模型能力,而是数据可达性——分析师需要在Bloomberg终端、各数据平台、Excel之间反复切换。现在"数据获取+AI分析+Excel建模"三合一,BigLaw Bench从43.7%翻倍到87.3%就是直接后果。

对金融行业从业者的冲击是双面的:初级分析师的"数据搬运"工作大部分可以被自动化;但资深分析师的"判断力"短期内不可替代。这与Anthropic上周发布的"理论覆盖94%但实际使用33%"的研究结论完全吻合。

💡 TAKEAWAY
如果你在金融行业工作,现在就注册ChatGPT for Excel的beta。不是为了替代你的工作,而是为了建立"AI+Excel"的复合技能壁垒。
1 最近动态
🌏 海外
HOT
WSJ · 2026-03-05
核心发现 OpenAI正洽谈将AI部署至北约32国共用的"非机密"网络,此前一周刚接入美国防部"机密网络"。Anthropic被叫停合作——因拒绝AI用于国内监控
关键数据
北约32国非机密网络 美国防部机密网络 禁止对美公民监控
影响判断 AI军事化应用路线分化——OpenAI拥抱国防、Anthropic坚守红线,长期影响深远
💰
多来源 · 2026-03
AI医疗创业公司获$4200万融资,打造"免费+医生把关"平台——AI分析健康数据生成方案(准确率比基准高142%),斯坦福/约翰霍普金斯医生审核。典型案例:被误诊35年的患者数小时内找到真正病因。
🇨🇳 国内
🇨🇳
多来源 · 2026-03
核心发现 成立仅两年完成25亿元融资,创国内具身智能单轮融资新高。国家AI产业基金、中国石化等国资联合加持
关键数据
25亿元单轮 估值超$30亿 百亿级合成数据
影响判断 国资大举进入具身智能赛道,"能交付"是获得认可的核心标准
🇨🇳
多来源 · 2026-03
仅隔2个月再融资,超额认购。联合斯坦福团队的Ctrl-World世界模型拿下WorldArena具身任务全球第一;自研ERA-42是全球首个全身+灵巧手端到端操作模型。
💡 深度聚焦
一周35亿:具身智能为什么突然成了"国家队"的最爱?

银河通用25亿+星动纪元10亿,一周内中国具身智能赛道融资35亿元。更值得关注的不是金额,而是投资方阵容——国家AI产业基金、中国石化、上汽金控等清一色国资和产业资本。这在AI领域极为罕见。

背后的逻辑是:具身智能是"AI+制造业"的交汇点。中国有全球最大的制造业体系(占全球30%+),但面临劳动力成本上升和人口老龄化的双重压力。具身智能机器人是解决这个结构性矛盾的"国家级方案"

两家公司的技术路线也代表了赛道的两条快车道:银河通用走"仿真数据为主"(自建银河星坊),星动纪元走"联合斯坦福学术合作"(Ctrl-World世界模型全球第一)。数据vs算法的竞争将定义2026-2027年技术走向。

💡 TAKEAWAY
具身智能正在复制2015-2016年自动驾驶的融资狂潮。对创业者:"能交付"是唯一的入场券。对投资者:关注"场景落地数据"而非"技术指标"。
1 最近动态
🌏 海外实践
HOT
Deloitte · 2026-03
核心发现 企业AI投资正从"实验"转向"规模化",提升生产力和效率是最主要的已实现收益
影响判断 "AI能不能用"的争论结束,"怎么用好"成为主话题
NEW
IBM · 2026-02
IBM在新一代FlashSystem中引入Agentic AI概念,存储系统可自主诊断、优化和自愈。Agentic AI从软件层扩展到基础设施层。
NEW
PwC · 2026-03
PwC警告:多数企业AI项目"众包式"推进导致与战略脱节,建议以精准执行替代广撒网。
🇨🇳 国内
🇨🇳
多来源 · 2026-03-02
核心发现 开源发布餐饮零售专属AI大模型"白泽"(Ostrakon-VL),基于Qwen3-VL-8B深度优化,24小时智能分析后厨直播视频
关键数据
超100个场景 调用超10亿次 Token消耗破万亿
影响判断 垂直行业AI大模型的教科书案例——不追求通用能力,在特定场景做到极致
🇨🇳
量子位 · 2026-03-06
在德清发布业界首个物理AI数据基座平台,填补行业物理AI数据基座空白。长三角具身智能数据采集训练场同步揭幕。
💡 深度聚焦
"白泽"模式:垂直行业AI的正确打开方式

淘宝闪购的"白泽"大模型为企业AI转型提供了一个教科书级的成功路径。它做了三个关键决策:1)基于已有开源模型(Qwen3-VL-8B)深度优化——省下巨额训练成本;2)聚焦单一垂直场景(餐饮食品安全)——100个细分场景做到极致;3)开源共享——构建生态而非围墙花园。

结果令人印象深刻:累计调用超10亿次、Token消耗破万亿,在"后厨直播"场景中已能24小时自动分析视频流。甚至能通过"一镜到底"视频验真来揪出AI伪造内容。这是一个"3+1+AI"共治体系(平台+监管+商家+骑士随手拍+AI)的完美落地。

对其他行业的启示:不要等通用大模型"万能化"再开始——现在就选一个高频、高价值、数据充足的垂直场景,基于开源模型做深度优化。8B参数的专精模型在特定场景可以完全胜任,训练成本只是通用大模型的百分之一。

💡 TAKEAWAY
审视你所在行业最大的"合规/质量/效率"痛点,评估是否适合开源模型+垂直微调的方式解决。餐饮食品安全只是开始——建筑安全、医疗质控、金融合规都是同类场景。
📊 数据速览
指标数值变化/说明
Claude Code从发布到登顶8个月超越Copilot和Cursor
工程师每周使用AI比例95%906人调查
工程师AI完成≥70%工作56%工作流渗透深度
AI Agent常用比例55%Staff+工程师63.5%
GPT-5.4投行基准87.3%vs此前43.7%
银河通用单轮融资25亿元具身智能新高,估值>$30亿
星动纪元融资10亿元估值破100亿元
白泽模型累计调用>10亿次Token消耗破万亿
千问AI春节DAU峰值7352万增幅940%
Claude Opus攻克猜想步数31步高德纳困扰数周的问题
📌 明日/下周值得关注
NVIDIA GTC 2026
3月16-19日 · Jensen Huang主题演讲
AWE 2026
3月12-15日 · AI科技·慧享未来
华为合作伙伴大会2026
3月19-20日 · 因聚而升融智有为
千问AI眼镜新功能
3月底 · 上线订外卖、订酒店等功能
💡 了解更多

AI洞察是一个系统化追踪AI行业动态的项目,每日/每周输出调研洞察,帮助你保持对AI行业的全局视野。覆盖大模型、AI Coding、AI应用、AI行业投融资、企业AI转型五大领域。

🏠 访问AI洞察首页