过去72小时内,中国AI公司完成了一次密集的模型发布:阿里Qwen3.5-Max-Preview(旗舰级)、MiniMax M2.7(受欢迎到限流)、小米MiMo-V2-Pro(接近GPT-5.2)、美团LongCat-Flash-Prover(数学证明SOTA)。这不是简单的'同质化内卷'——每家公司都在走差异化路线。
阿里走的是全能旗舰路线:235B参数MoE架构瞄准代码/数学/多语言的全面能力。MiniMax走的是性价比路线:M2.7受欢迎到需要限流,说明市场对高性价比模型的需求巨大。美团最有趣——用5677B参数+Lean4验证做数学证明,在垂直方向上做到了全球SOTA。海外方面,Mistral Small 4则用'三合一'策略降低企业的多模型管理成本。
与Nature Communications论文的发现形成对照:22/26个SOTA对齐模型可被100%攻破,说明模型能力的增长和安全性的保障之间仍存在巨大鸿沟。国产模型密集发布的同时,安全对齐的可靠性值得持续关注。