英伟达推出Vera Rubin平台：算力效率跃升，AI推理成本大幅降低-网界

在2026年GTC大会上，英伟达正式推出Vera Rubin AI平台，旨在加速智能体AI（Agentic AI）的技术演进。这一平台被公司创始人兼首席执行官黄仁勋称为“代际飞跃”，标志着其历史上最大规模AI基础设施建设的启动，覆盖从大规模预训练到实时推理的完整AI生命周期。

在算力架构方面，新一代NVL72机架通过NVLink 6技术将72块Rubin GPU与36块Vera CPU深度整合，实现了计算效率的突破性提升。相较于前代Blackwell平台，该系统在混合专家大模型（MoE）训练中仅需四分之一的GPU资源，同时将每瓦推理吞吐量提高10倍，单Token处理成本降低至十分之一。

针对AI模型验证环节，英伟达设计了专用Vera CPU机架，集成256块液冷CPU。该架构通过优化散热设计，使运行效率达到传统CPU的两倍，数据处理速度提升50%，为大规模模型验证提供了高效支撑。

为满足智能体系统对低延迟和长上下文的需求，英伟达同步推出Groq 3 LPX推理加速机架。该系统配备256个LPU处理器，与Vera Rubin平台协同工作时，每兆瓦推理吞吐量最高可提升35倍，显著优化了实时交互场景的性能表现。

在数据存储领域，全新BlueField-4 STX机架构建了AI原生存储架构。基于DOCA Memos框架，该系统可高效处理大型语言模型生成的海量键值（KV）缓存数据，在降低能耗的同时将推理吞吐量提升最高5倍，为多轮AI对话等复杂场景提供更快的响应能力。

大模型架构图集上线：30余款开源模型对比清晰助力开发者与研究者

他把过去几个月撰写的两篇长文《The Big LLM Architecture Comparison》和《A Dream of Springfor Open-Weight LLMs》中绘制的所有架构图抽取…

2026-03-17

小红书视频发布效率低？资深运营“效率流”三步法助你轻松破局

我最早用的是国外的一些效率神器，比如Buffer和Hootsuite，它们确实能解决多平台发布的问题，但有两个致命缺点：一是对国内平台支持不够友好（特别是某红书这种有特殊规则的平台），二是价格昂贵，对中小团…

2026-03-17

雷军谈新一代SU7：外形延续经典，内部升级带来全新体验

2026-03-17

阿里巴巴成立Alibaba Token Hub事业群全面推进AI战略布局

这是阿里巴巴面向AI Agent时代的一次重要组织调整，以Token Hub为核心主线，强化AI业务战略协同，全面推进阿里AI战略落地。Alibaba Token Hub包括通义实验室、MaaS业务线、千…

2026-03-17

三星Galaxy S26 Ultra One UI 9系统开启内部测试或随新折叠屏手机亮相

IT之家 3 月 16 日消息，据科技媒体 SammyGuru 今天报道，三星服务器最近出现 Galaxy S26Ultra 手机的首个 OneUI 9 系统测试包，表明官方已经在进行内部测试。预计将随下一…

2026-03-17

vivo X300s来袭：影像升级搭配200mm增距镜，超长焦人像自由轻松实现

IT之家 3 月 16 日消息，vivo 通信科技有限公司产品经理韩伯啸今日发文预热了 vivo X300s。新机号称「超能小 V单」，重点提升了影像系统，拥有不少 X300 Ultra 同款的影像能力。 …

2026-03-17

华为畅享90系列3月23日发布：麒麟鸿蒙组合加持，大屏长续航成亮点

在此之前，互联网上已经有这两款新机的爆料信息了。同时，华为这家智能手机厂商首次在畅享系列中配备麒麟8系处理器，该芯片此前多用于定位更高的nova系列，此次下放意味着中端机型性能将大幅提升。与此相对应的是，华…

2026-03-16