Grok 3大战绩背后：马斯克豪掷20万GPU，DeepSeek低成本路线更胜一筹？-网界

马斯克的人工智能公司xAI近日震撼发布了其最新的Grok 3大模型，这款模型被马斯克亲自誉为“地球上最聪明的人工智能”。

据悉，Grok 3是在20万块英伟达芯片的庞大算力支持下训练而成，其运算能力相较于上一代模型提升了整整十倍。在xAI的直播演示中，马斯克与三位工程师共同见证了Grok 3在数学、科学和编程等多个基准测试中的卓越表现，成功击败了包括谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude以及OpenAI的GPT-4在内的众多强劲对手。

马斯克透露，Grok 3的训练过程基于大量的合成数据，模型会不断检查数据的逻辑一致性，并自动删除错误数据。在AIME'24数学能力测试、GPQA科学知识评估以及LCB Oct - Feb编程能力测试等多项测试中，Grok 3均取得了优于DeepSeek的成绩，展现了其强大的“思维链”推理机制，能够像人类一样逐步拆解并解决复杂任务。其参数量更是达到了惊人的1万亿级别。

然而，尽管Grok 3在多项测试中表现出色，但其高昂的成本也不容忽视。据透露，Grok 3的训练成本高达30亿美元，这主要得益于其庞大的算力需求。xAI为了在四个月内迅速推出Grok 3，不惜投入巨资建设数据中心，最终在122天内成功启动了第一批10万个GPU。而为了实现更理想的AI性能，团队更是仅用92天就将超算集群的算力翻倍，GPU数量达到了20万块。

以英伟达H100为例，单卡价格约为2.5万至3万美元，这意味着20万块GPU的硬件采购成本就高达60亿美元。再加上配套服务器、网络设备、电力和冷却设施等额外成本，Grok 3的总成本可能高达百亿美元量级。相比之下，DeepSeek的训练成本仅为600万美元，远低于GPT-4的7800万美元。尽管DeepSeek在中文理解和多模态交互方面表现出色，但其低成本模式同样令人瞩目。

Grok 3的发布不仅彰显了马斯克在人工智能领域的雄心壮志，也引发了业界对于算力与成本之间平衡的深刻思考。在AI大模型发展日新月异的今天，如何在保持模型性能的同时降低成本，成为了摆在所有从业者面前的一道难题。而DeepSeek的成功经验无疑为这一难题提供了一个值得借鉴的解决方案。