网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

英伟达推出Vera Rubin平台:算力效率跃升,AI推理成本大幅降低

2026-03-17来源:互联网编辑:瑞雪

在2026年GTC大会上,英伟达正式推出Vera Rubin AI平台,旨在加速智能体AI(Agentic AI)的技术演进。这一平台被公司创始人兼首席执行官黄仁勋称为“代际飞跃”,标志着其历史上最大规模AI基础设施建设的启动,覆盖从大规模预训练到实时推理的完整AI生命周期。

在算力架构方面,新一代NVL72机架通过NVLink 6技术将72块Rubin GPU与36块Vera CPU深度整合,实现了计算效率的突破性提升。相较于前代Blackwell平台,该系统在混合专家大模型(MoE)训练中仅需四分之一的GPU资源,同时将每瓦推理吞吐量提高10倍,单Token处理成本降低至十分之一。

针对AI模型验证环节,英伟达设计了专用Vera CPU机架,集成256块液冷CPU。该架构通过优化散热设计,使运行效率达到传统CPU的两倍,数据处理速度提升50%,为大规模模型验证提供了高效支撑。

为满足智能体系统对低延迟和长上下文的需求,英伟达同步推出Groq 3 LPX推理加速机架。该系统配备256个LPU处理器,与Vera Rubin平台协同工作时,每兆瓦推理吞吐量最高可提升35倍,显著优化了实时交互场景的性能表现。

在数据存储领域,全新BlueField-4 STX机架构建了AI原生存储架构。基于DOCA Memos框架,该系统可高效处理大型语言模型生成的海量键值(KV)缓存数据,在降低能耗的同时将推理吞吐量提升最高5倍,为多轮AI对话等复杂场景提供更快的响应能力。

大模型架构图集上线:30余款开源模型对比清晰 助力开发者与研究者
他把过去几个月撰写的两篇长文《The Big LLM Architecture Comparison》和《A Dream of Springfor Open-Weight LLMs》中绘制的所有架构图抽取…

2026-03-17

小红书视频发布效率低?资深运营“效率流”三步法助你轻松破局
我最早用的是国外的一些效率神器,比如Buffer和Hootsuite,它们确实能解决多平台发布的问题,但有两个致命缺点:一是对国内平台支持不够友好(特别是某红书这种有特殊规则的平台),二是价格昂贵,对中小团…

2026-03-17

阿里巴巴成立Alibaba Token Hub事业群 全面推进AI战略布局
这是阿里巴巴面向AI Agent时代的一次重要组织调整,以Token Hub为核心主线,强化AI业务战略协同,全面推进阿里AI战略落地。Alibaba Token Hub包括通义实验室、MaaS业务线、千…

2026-03-17

三星Galaxy S26 Ultra One UI 9系统开启内部测试 或随新折叠屏手机亮相
IT之家 3 月 16 日消息,据科技媒体 SammyGuru 今天报道,三星服务器最近出现 Galaxy S26Ultra 手机的首个 OneUI 9 系统测试包,表明官方已经在进行内部测试。预计将随下一…

2026-03-17

vivo X300s来袭:影像升级搭配200mm增距镜,超长焦人像自由轻松实现
IT之家 3 月 16 日消息,vivo 通信科技有限公司产品经理韩伯啸今日发文预热了 vivo X300s。新机号称「超能小 V单」,重点提升了影像系统,拥有不少 X300 Ultra 同款的影像能力。 …

2026-03-17

华为畅享90系列3月23日发布:麒麟鸿蒙组合加持,大屏长续航成亮点
在此之前,互联网上已经有这两款新机的爆料信息了。 同时,华为这家智能手机厂商首次在畅享系列中配备麒麟8系处理器,该芯片此前多用于定位更高的nova系列,此次下放意味着中端机型性能将大幅提升。与此相对应的是,华…

2026-03-16