网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌第八代TPU登场:TPU 8t强训练、TPU 8i破延迟,助力AI应用新飞跃

2026-04-23来源:快讯编辑:瑞雪

在Cloud Next '26峰会上,谷歌宣布推出第八代TPU架构,包含TPU 8t和TPU 8i两款芯片,分别针对AI训练与推理场景优化。TPU 8t主打大规模训练性能,TPU 8i则聚焦低延迟推理,两者预计于2026年下半年正式商用。目前该系列芯片采用申请制开放,Google Cloud用户需通过官网提交使用需求,原生PyTorch支持等软件功能仍处于预览阶段,仅向特定合作伙伴及早期客户开放测试。

TPU 8t通过SparseCore核心与Virgo网络拓扑的协同设计,将大规模预训练效率提升至新高度。其采用3D Torus网络架构,单个超级计算单元可集成9600颗芯片,共享2PB内存资源,总算力达121 ExaFlops。针对混合专家模型(MoE)的稀疏计算特性,SparseCore技术使矩阵乘法单元专注核心运算,避免因不规则内存访问导致的性能损耗。数据传输层面,Virgo网络将芯片间通信带宽翻倍,外部数据中心连接带宽提升四倍,配合Direct Storage技术绕过CPU直接读取高速存储,使训练速度提升十倍,单位算力性价比较前代提高2.7倍。

TPU 8i的硬件设计围绕长上下文推理场景展开。其配备288GB高带宽内存与384MB片上SRAM(容量较前代增加三倍),可将完整对话上下文缓存至芯片内部,减少外部数据交互频次。针对混合专家模型推理时的集体通信需求,CAE加速引擎将芯片间数据同步延迟降低五倍,互联带宽提升至19.2 Tb/s。网络拓扑方面,Boardfly架构借鉴Dragonfly设计思想,通过增加长距离直连链路,使1024颗芯片组成的系统中最远通信距离从16跳缩短至7跳,降幅达56%。这些优化使TPU 8i在推理任务中的性价比提升80%,配合谷歌自研Arm Axion架构CPU的能效优化,系统整体运行流畅度显著提升。

谷歌此次将TPU 8t与TPU 8i全面开放给云客户,支持PyTorch、JAX等主流AI框架,开发者无需学习新编程语言即可调用算力资源。公司同步提供开源参考模型代码,降低技术上手门槛。该举措旨在解决AI应用响应延迟的核心痛点——传统架构下用户语音数据需往返远程数据中心处理,而第八代TPU通过芯片级优化与网络拓扑革新,显著缩短数据传输路径,为实时交互类AI应用提供算力支撑。

随着AI训练与推理需求分化,谷歌TPU产品线正式进入精细化分工阶段。TPU 8t通过超级计算集群与稀疏计算优化,满足千亿参数模型训练需求;TPU 8i则凭借大容量缓存与低延迟通信,支撑复杂推理场景。这种设计思路与谷歌Gemini大模型的运行需求深度契合,也为全球开发者构建智能体时代的应用生态奠定算力基础。

马斯克1万亿美元薪酬方案引关注,人形机器人成中美AI赛道新焦点
更值得关注的是,华尔街与硅谷曾达成共识,认为 AI 算力赛道烧钱过猛,需要放缓投入节奏。 国内人形机器人企业宇树硬件实力突出,但缺乏领先的AI 大模型支持,而特斯拉是目前全球唯一能将人形机器人与 AI 大…

2026-04-23

谷歌云:AI浪潮下以全栈布局与资本投入,铸就增长新引擎与竞争壁垒
更值得深入探讨的问题是:谷歌将如何将这一基础设施优势向上延伸,以及是否能够将资本支出的快速增长转化为持续的云动能和企业客户的差异化价值。谷歌是唯一一家同时拥有前沿模型、与OpenAI和Anthropic同台竞…

2026-04-23

REDMI K90 Max深度评测:风冷散热搭配双芯,手游体验再攀巅峰
对于追求极致手游体验的玩家而言,REDMI K90 Max无疑是现阶段最值得入手的选择——它没有为了性能牺牲日常使用体验,大电池、好屏幕、够用的影像,让它既能在游戏中carry全场,也能从容应对日常通勤、影…

2026-04-23

科技与艺术的完美融合:HIFIMAN Edition XS耳机开启声学新体验
这款耳机采用纳米级超薄振膜,配合隐形磁体技术,能够精准还原音乐中的每一个细节,从低频的深沉到高频的清澈,都能完美呈现。 HIFIMANEdition XS隐形磁体版平板振膜耳机以其卓越的音质表现和舒适的佩戴…

2026-04-23