网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

SambaNova发布DeepSeek-R1 671B云服务,自研芯片助力成就推理新速度

2025-02-21来源:ITBEAR编辑:瑞雪

近期,专注于AI芯片与解决方案的SambaNova公司宣布了一项重大进展,在其基于自主研发的SN40L RDU处理器的云平台上,推出了DeepSeek-R1 671B模型推理云服务。据称,这一服务在业界内以极快的token输出速度脱颖而出,每秒可处理198个prompts。

SN40L RDU芯片是SambaNova的技术核心,它采用了台积电先进的5nm制程工艺,BF16算力高达638 TFLOPS。更令人瞩目的是其独特的三层存储结构设计:片内配备了520MB的SRAM缓存,通过2.5D封装集成了64GB的HBM内存,外加片外的1.5TB超大容量DDR DRAM内存。这一设计使得SN40L RDU芯片能够容纳远超同类竞品的模型参数。

除了强大的硬件配置,SN40L RDU芯片在结构上还具备高度的灵活性。它能够根据实际需求动态重新配置硬件资源和数据流,从而显著提升计算效率和内存访问速度。这种灵活性使得SambaNova的云平台在处理复杂AI任务时,能够展现出卓越的性能。

SambaNova公司进一步强调,他们仅需一个配备16个SN40L RDU芯片的机架,即可成功部署DeepSeek-R1 671B模型推理服务。这一部署方案不仅高效,而且大大降低了运营成本,为AI应用的广泛推广奠定了坚实基础。

安谋科技发布“周易”X3 NPU IP,AIGC大模型能力跃升开启端侧AI新篇
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-15

百度李彦宏2025世界大会发声:AI内化驱动,开启生产力革命新篇章
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14