英伟达近日宣布,其首款自主研发的Vera CPU已正式交付给首批客户,包括Anthropic、OpenAI、xAI以及Oracle Cloud Infrastructure(OCI)。这一动作标志着这款专为代理式人工智能设计的处理器从发布阶段迈向实际应用,英伟达在AI基础设施领域的布局进一步延伸至CPU层面。
据知情人士透露,这批Vera CPU于5月15日抵达三家顶尖AI实验室:Anthropic位于旧金山SoMa的办公室、OpenAI在Mission Bay的总部,以及xAI设在帕罗奥图的研发中心。随后,设备于5月18日被送至圣塔克拉拉市的Oracle AI卓越客户中心。英伟达大规模与高性能计算副总裁Ian Buck亲自参与了交付过程,凸显公司对这一项目的重视程度。
Vera CPU的定位是满足代理式AI工作负载的特殊需求。与传统推理场景不同,这类模型不仅需要生成回答,还需执行工具调用、协调复杂流程、处理长上下文信息以及应对实时任务,对CPU的性能提出了更高要求。英伟达此前在3月的GTC大会上首次发布这款产品,并将其视为未来数十亿美元规模的业务增长点。此次交付意味着Vera CPU正式进入生产环境,开始接受实际场景的检验。
技术参数方面,Vera CPU搭载了88颗英伟达自主研发的Olympus核心,内存带宽达到1.2 TB/s,单核性能较前代提升约50%。这些特性使其在高负载、并行化且需要实时响应的工作中表现出色,有助于提升AI工厂的整体效率和反应速度。英伟达强调,该处理器专为代理式AI的复杂需求设计,能够支持更高效的模型训练与推理。
客户反馈显示,各机构对Vera CPU的期待值颇高。Anthropic的计算负责人James Bradbury表示,算力的扩充是推动模型发展的关键因素;OpenAI的计算基础设施负责人萨钦·卡蒂在接收设备时,英伟达团队甚至现场拆解机壳展示内部结构;xAI创始人马斯克亲自参与说明会,详细询问了核心数量、内存配置及散热设计,并透露公司正在评估将Vera CPU应用于强化学习与代理式模拟流程的可能性。
Oracle Cloud Infrastructure主管Karan Batta透露,公司计划从今年开始部署数十万颗Vera CPU,以满足代理式AI在大规模环境下对持续性能的要求。作为首家在超大规模层面部署该处理器的云端服务商,OCI将为企业客户提供更接近生产级的代理式AI基础设施,进一步降低技术落地的门槛。