中美AI大模型路线之争：马斯克力大砖飞，梁文锋降本增效谁将胜出？-网界

近日，AI领域迎来了两大重要进展。一方面，埃隆·马斯克旗下的xAI公司发布了名为Grok3的大型语言模型，凭借在多项测试中的卓越表现，迅速登顶大模型测评榜。另一方面，DeepSeek与Kimi团队则分别发布了两篇关于如何降低长文本计算量、提升训练效率的论文，聚焦于AI技术的降本增效。

Grok3的发布无疑是AI界的一大震撼。据马斯克介绍，该模型采用了20万张英伟达H100芯片进行训练，性能强劲。在直播发布会上，xAI展示了其新建的数据中心，强调了大型算力集群对于智能提升的重要性。Grok3在大模型竞技场Chatbot Arena中的得分刷新了记录，凸显了其技术实力。这一成就不仅证明了“尺度定律”的有效性，也进一步提振了市场对算力供应商的信心，英伟达股价随之企稳回升。

然而，马斯克并未提及Grok3的开源计划。尽管他曾表示将在发布下一代模型后开源上一代模型，但Grok3目前依然是闭源的。这一做法与DeepSeek形成了鲜明对比。自DeepSeek爆火以来，其始终坚持开源模式，将技术研究免费分享给全球用户。近日，DeepSeek更是宣布将在未来一周内开源5个代码库，以完全透明的方式分享其进展。

在DeepSeek发布的论文中，提出了一种名为NSA的原生稀疏注意力机制。该机制通过压缩、选择和滑动的方式处理输入序列，减少了计算量，同时保持了模型性能。据DeepSeek介绍，NSA在基准测试中的得分优于传统全注意力模型，且计算速度显著提高。这一成果得到了业界的广泛认可，包括原谷歌顶级工程师Lucas Beyer在内的多位专家都给予了高度评价。

与此同时，Kimi团队也发布了一篇类似的论文，介绍了一种名为MoBA的块状混合注意力机制。该机制同样通过分割长文本并动态选择块的相关性来提高计算效率。值得注意的是，DeepSeek和Kimi的这两篇论文都强调了可以无缝集成到现有语言模型中，无需重新训练，这为现有大模型的加速提供了直接可行的方案。

面对DeepSeek和Kimi在降本增效方面的努力，马斯克及其xAI团队似乎并未受到影响。他们依然坚持通过扩大算力规模来提升模型性能。然而，这种做法也引发了业界对于性价比的讨论。有观点认为，尽管算力扩张能够带来性能提升，但高昂的成本并非所有企业都能承受。相比之下，DeepSeek的开源模式更有助于推动AI技术的普及和发展。

尽管Grok3目前是闭源的，但xAI近期宣布将免费提供Grok3的服务，直到服务器崩溃为止。这一举措或许能够吸引更多用户体验其强大的功能，但长远来看，开源模式仍然是推动AI技术发展的重要力量。DeepSeek的持续开源不仅有助于降低技术门槛，还能够促进全球范围内的技术创新和合作。

在AI技术日新月异的今天，中美两国的大模型发展路径呈现出明显的差异。美国企业更倾向于通过扩大算力规模来提升性能，而中国企业则更加注重降本增效和开源共享。这两种路径各有优劣，但最终的目标都是推动AI技术的普及和发展。未来，随着技术的不断进步和应用的不断拓展，中美两国在AI领域的竞争与合作将更加激烈。

阿里巴巴“通义”App升级更名“千问”，AI战略转向消费级市场新布局

根据官方消息，“千问”定位为阿里旗下最重要的大模型应用入口，其核心能力基于阿里自研的大模型体系Qwen（千问）。分析人士指出，阿里此前在To B市场和模型研发侧拥有技术基础，但在消费端应用分发层面还未形成…

2025-11-15

三只羊停播后首迎复播潮小杨臻选低调回归20分钟销量可观

2025-11-14

帮主郑重：外资餐饮“卖身”背后，中国消费市场变局几何？

2025-11-14

Dexmal原力灵机获近10亿融资阿里蔚来资本助力具身智能研发落地

IT之家 11 月 14 日消息，具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资，阿里巴巴为独家投资方。IT之家注意到，该公司 A 轮融资由蔚来资本领投，洪泰基金、联想创投、锡创投和正…

2025-11-14

OpenAI前CTO穆拉蒂AI公司估值或达500亿新融资引关注

2025-11-14

中芯国际Q3营收利润双增创新高收入构成优化产能利用率攀升

2025-11-14

上海萝博派对科技获千万级美元种子轮融资携手经纬小米等共拓人形机器人新蓝海

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先

文心5.0基础能力全面升级，在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出，拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式，文心5.0的技术路…

2025-11-13

蜜雪集团：以供应链为基，凭低价策略拓全球千亿版图

2025-11-13