本周OpenAI以罕见节奏发布GPT-5.3 Instant(3/3)和GPT-5.4(3/5),定位完全不同:5.3 Instant聚焦"用户体验"(降幻觉26.8%、减少说教),5.4聚焦"Agent能力"(Computer Use超人类、Tool Search降成本47%)。
这不是简单的产品迭代,而是从"对话AI"到"操作AI"的范式转变。OpenAI正在以闪电战速度构建从基础模型到Agent工具链的完整生态护城河。
Anthropic研究(3/6)、Block裁员近半(3/6)、美国2月非农减少9.2万(3/6)三者在同一周汇聚。但Salesforce CEO的"AI washing"质疑提醒我们区分"真AI驱动"和"借AI之名"。
最关键的数据:AI理论覆盖94%但实际使用仅33%——61%的鸿沟待收窄。Computer Use能力正是弥合鸿沟的关键技术,预计2027-2028年实际覆盖率将升至55-65%。
ChatGPT进军Excel(3/6)、Figma双向集成(3/6)、Cursor MCP Apps(3/3)——AI不再是"打开一个App去用",而是"在你已经使用的工具里等你"。
| 日期 | 事件 | 来源 | 重要度 |
|---|---|---|---|
| 3/2 | Anthropic Claude大规模服务中断 | TechCrunch | 🔴 |
| 3/3 | OpenAI与国防部达成AI分类部署协议 | OpenAI | 🔴 |
| 3/3 | GPT-5.3 Instant发布:幻觉率降低26.8% | OpenAI | 🔴 |
| 3/3 | DeepSeek拒绝向NVIDIA展示V4模型 | Reuters | 🔴 |
| 3/5 | Gemini 3.1 Flash-Lite Preview发布 | 🔴 | |
| 3/5 | Apple新Siri将采用定制版Gemini | 🔴 | |
| 3/5 | GPT-5.4 Thinking发布:支持中途调整方向 | OpenAI | 🔴 |
| 3/6 | Anthropic发布AI就业影响研究 | Anthropic | 🔴 |
| 3/8 | GPT-5.4 Computer Use首超人类(OSWorld 75.0%) | OpenAI | 🔴 |
| 3/8 | 阿里正式批准林俊旸辞职 | 机器之心 | 🇨🇳 |
| 日期 | 事件 | 来源 | 重要度 |
|---|---|---|---|
| 3/3 | Cursor Cloud Agents:自主运行+测试+演示 | Cursor | 🔴 |
| 3/3 | Cursor Bugbot Autofix:35%修复被直接合并 | Cursor | 🔴 |
| 3/3 | Latent Space宣告"Code Review之死" | Latent Space | 🟡 |
| 3/4 | Cursor 2.6 MCP Apps:可视化协作 | Cursor | 🔴 |
| 3/5 | Codex桌面App登陆Windows | OpenAI | 🔴 |
| 3/6 | GPT-5.4整合Codex编程能力 | OpenAI | 🔴 |
| 3/7 | GitHub Copilot v1.110 + Figma MCP集成 | GitHub | 🔴 |
| 3/8 | GPT-5.4 Codex原生Computer Use+Playwright | OpenAI | 🔴 |
| 3/8 | Claude Code在VS Code排行榜超越Codex | VS Magazine | 🟡 |
| 3/8 | 36氪:AI Coding大有可为,Vibe Coding先洗洗睡 | 36氪 | 🇨🇳 |
AI Coding三足鼎立+快速趋同:Cursor(Cloud Agents+Bugbot闭环)、Codex(全平台+Computer Use)、Claude Code(VS Code市场第一)。好功能数周内被竞品学习,竞争核心从"代码质量"转向"端到端工作流集成"。
| 日期 | 事件 | 来源 | 重要度 |
|---|---|---|---|
| 3/3 | Claude超越ChatGPT登顶App Store第一 | Mashable | 🔴 |
| 3/3 | ChatGPT Projects新增多源知识库 | OpenAI | 🟡 |
| 3/4 | Samsung Galaxy S26主打"下一代AI手机" | Samsung | 🔴 |
| 3/5 | Google Gemini Home推出Live Search视觉AI | Mashable | 🔴 |
| 3/7 | ChatGPT for Excel + 金融数据集成 | OpenAI | 🔴 |
| 3/7 | Figma双向集成:设计↔代码完整闭环 | Figma | 🔴 |
| 3/8 | Gemini聊天机器人面临"导致用户自杀"诉讼 | Reuters | 🔴 |
| 3/8 | 美团Tabbit AI搜索进入公测 | 36氪 | 🇨🇳 |
| 公司/项目 | 融资额 | 估值 | 亮点 |
|---|---|---|---|
| OpenAI | $1100亿 | $8400亿 | 史上最大私募融资 |
| Anthropic | $300亿 | $3800亿 | 史上第三大融资 |
| Waymo | $160亿 | — | 自动驾驶 |
| Anduril | ~$40亿 | $600亿 | 防务AI,估值翻倍 |
| Arda (前OpenAI CRO) | $7000万 | — | 自主工厂AI |
| 小雨智造 | 数亿元 | — | 具身智能 |
| 银河通用 | 25亿元 | — | AI+具身智能 |
| 欧盟EURO-3C | €7500万 | — | 联邦边缘云 |
| 日期 | 事件 | 来源 | 类型 |
|---|---|---|---|
| 3/3 | Dropbox用Cursor重构AI基础设施(55万文件) | Cursor Blog | 实践 |
| 3/3 | "第一批用AI替换员工的老板,暴雷了" | 融中财经 | 🇨🇳警示 |
| 3/4 | 中国电信AI代码生成占比达40% | 中国电信 | 🇨🇳实践 |
| 3/4 | 华为发布115个行业智能化案例 | 华为 | 实践 |
| 3/6 | 德勤2026数字化挑战赛:AI×组织 | 德勤 | 趋势 |
| 3/7 | OpenAI发布"五大AI价值模型" | OpenAI | 方法 |
| 3/8 | Block裁员近半,引"AI washing"争议 | Fortune | 🔴 |
| 3/8 | McKinsey发布"主权AI"报告 | McKinsey | 研究 |
| 企业 | AI场景 | 效果指标 |
|---|---|---|
| 中国电信 | AI代码生成 | 占比40%,研发效率+20% |
| Dropbox | AI原生基础设施重构 | 55万文件建索引 |
| Block | AI驱动组织精简 | 裁员近半(争议中) |
| 华为 | 行业智能化 | 115个案例 |
核心矛盾从"技术问题"转向"组织问题":OpenAI发布方法论、Anthropic发布就业研究、德勤以"AI×组织"为主题——三方信号一致:技术已就绪,瓶颈在于组织如何适应。