GTC 2026上最值得深思的不是某颗芯片,而是黄仁勋对数据中心的重新定义——'Token工厂'。当数据中心变成Token工厂,核心竞争力就从'谁的模型更大'变成了'谁的每瓦Token成本更低'。电力,而非算法,正在成为AI竞争的真正瓶颈。
数据最残酷:从ChatGPT(生成)到o1(推理)到Agent(行动),AI计算需求增长了约100万倍。黄仁勋预计到2027年全球AI算力需求至少1万亿美元。这不是'画饼'——这是电力、芯片、软件全栈优化的现实推演。
Groq 3 LPU的战略意义正在于此:NVIDIA通过$200亿收购Groq,补齐了低延迟推理短板。GPU擅长高吞吐,LPU擅长低延迟——两者结合使tokens/瓦提升35x。这相当于在不增加电力消耗的情况下,让同一座数据中心多生产35倍的Token。