网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

Grok 3大战绩背后:马斯克豪掷20万GPU,DeepSeek低成本路线更胜一筹?

2025-02-23来源:钛媒体APP编辑:瑞雪

马斯克的人工智能公司xAI近日震撼发布了其最新的Grok 3大模型,这款模型被马斯克亲自誉为“地球上最聪明的人工智能”。

据悉,Grok 3是在20万块英伟达芯片的庞大算力支持下训练而成,其运算能力相较于上一代模型提升了整整十倍。在xAI的直播演示中,马斯克与三位工程师共同见证了Grok 3在数学、科学和编程等多个基准测试中的卓越表现,成功击败了包括谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude以及OpenAI的GPT-4在内的众多强劲对手。

马斯克透露,Grok 3的训练过程基于大量的合成数据,模型会不断检查数据的逻辑一致性,并自动删除错误数据。在AIME'24数学能力测试、GPQA科学知识评估以及LCB Oct - Feb编程能力测试等多项测试中,Grok 3均取得了优于DeepSeek的成绩,展现了其强大的“思维链”推理机制,能够像人类一样逐步拆解并解决复杂任务。其参数量更是达到了惊人的1万亿级别。

然而,尽管Grok 3在多项测试中表现出色,但其高昂的成本也不容忽视。据透露,Grok 3的训练成本高达30亿美元,这主要得益于其庞大的算力需求。xAI为了在四个月内迅速推出Grok 3,不惜投入巨资建设数据中心,最终在122天内成功启动了第一批10万个GPU。而为了实现更理想的AI性能,团队更是仅用92天就将超算集群的算力翻倍,GPU数量达到了20万块。

以英伟达H100为例,单卡价格约为2.5万至3万美元,这意味着20万块GPU的硬件采购成本就高达60亿美元。再加上配套服务器、网络设备、电力和冷却设施等额外成本,Grok 3的总成本可能高达百亿美元量级。相比之下,DeepSeek的训练成本仅为600万美元,远低于GPT-4的7800万美元。尽管DeepSeek在中文理解和多模态交互方面表现出色,但其低成本模式同样令人瞩目。

Grok 3的发布不仅彰显了马斯克在人工智能领域的雄心壮志,也引发了业界对于算力与成本之间平衡的深刻思考。在AI大模型发展日新月异的今天,如何在保持模型性能的同时降低成本,成为了摆在所有从业者面前的一道难题。而DeepSeek的成功经验无疑为这一难题提供了一个值得借鉴的解决方案。

安谋科技发布“周易”X3 NPU IP,AIGC大模型能力跃升开启端侧AI新篇
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-15

百度李彦宏2025世界大会发声:AI内化驱动,开启生产力革命新篇章
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14