网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

出身商汤的曦望:押注推理GPU,三年构建三代芯片矩阵谋突破

2026-01-23来源:天脉网编辑:瑞雪

在高性能GPU及多模态推理芯片领域,一家名为曦望的新兴企业正以独特的技术路线和战略布局引发行业关注。这家脱胎于商汤科技大芯片部门的公司,自2024年底独立运营以来,已构建起覆盖视觉推理、通用计算及超低功耗场景的三代芯片产品矩阵,其"纯推理"技术路线与英伟达等传统厂商形成鲜明对比。

技术团队构成彰显着这家企业的专业底色。200余人的正式员工中,80%为技术研发人员,核心骨干平均拥有15年行业经验,硕士及以上学历占比超八成。董事长徐冰作为商汤科技联合创始人,曾主导完成超66亿美元融资及港交所IPO;联席CEO王勇兼具AMD首席架构师与百度昆仑芯核心架构师双重背景,主导过多款7nm芯片全流程开发;另一位联席CEO王湛则是百度创始团队成员,在芯片商业化领域拥有16年实战经验。

区别于行业主流的"训推一体"架构,曦望选择专注推理场景优化。通过重构调度机制、缓存设计及片上SRAM架构,融合LPDDR内存技术,其芯片在单位Token推理成本上实现数量级突破。据技术白皮书披露,正在研发的S3芯片将原生支持FP8/FP4低精度计算,目标将百万Token推理成本压缩至1分钱,较现有方案降低90%以上。

产品迭代轨迹印证着企业的技术积累。2020年量产的S1芯片作为国内首款视觉推理专用芯片,已向索尼、小米等企业授权IP;2024年推出的S2芯片实现CUDA生态兼容,成功适配DeepSeek、Qwen等主流模型;即将在2026年面世的S3芯片则定位"推理性价比之王",在能耗控制与计算密度上达到行业新高度。这种三代产品协同发展的格局,使其能够覆盖从边缘设备到数据中心的完整推理场景。

商业落地层面,曦望已形成IP授权与芯片销售双轮驱动模式。S1芯片通过IP授权方式进入消费电子领域,S2芯片则直接切入AI算力市场,与多家云服务提供商达成合作意向。据内部人士透露,过去四年20亿元的研发投入,主要聚焦在编译器优化、芯片互联等底层技术创新,这些积累正在转化为显著的成本优势。

"当推理成本下降90%,我们改变的不仅是芯片市场格局,更是整个AI产业的成本结构。"王湛在近期技术分享会上强调。这种以极致性价比重构产业生态的思路,正吸引着越来越多合作伙伴加入其生态体系。随着S3芯片量产临近,这场由推理芯片引发的产业变革或将进入新的阶段。

百度文心Moment大会启幕 文心5.0正式版上线引领AI应用新突破
矩阵模型面向产品级应用和通用场景快速落地,包括文心Lite模型、视频大模型和语音大模型;专精模型面向行业应用和垂直场景,包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型。 基于强大的原生全模…

2026-01-23

百度网盘推广新机制:移动端邀请奖励更高,转存激励持续累积
当受邀用户在使用过程中产生转存行为(即每天首次将文件保存至自己的网盘),推广达人还可按日均转存数量获得额外回馈。活动力度的加大既体现在邀请激励上,也贯穿于这条长期互动的链条中。 你的每一次有效邀请,都可能…

2026-01-23

亚马逊2026 Nova AI挑战赛启幕:聚焦可信软件智能体应用开发新赛道
将从2026年Amazon NovaAI挑战赛申请池中选出十支大学团队,作为开发团队(在智能体编码系统中构建防御和可靠性)或红队(探测系统以揭示故障和安全弱点)参与竞赛。A:2026年Amazon No…

2026-01-23

苹果市场复苏点燃供应链新引擎,瑞声科技等“果链”企业迎业绩增长黄金期
在这两大关键产品趋势的驱动下,京东方、瑞声科技、奇鋐科技等核心供应链企业,正迎来业绩放量的黄金发展期。此外,供应链消息确认,苹果将于2026年9月推出首款折叠屏手机“iPhone Fold”,采用内外双屏方…

2026-01-23

OpenAI迈出商业化关键一步:ChatGPT平台将推广告,采用浏览量收费新模式
据路透社和The Information等媒体报道,知情人士消息称,OpenAI已正式向数十家广告商伸出橄榄枝,为其聊天机器人ChatGPT平台广告业务拉新。这一举措标志着 OpenAI 在商业化道路上迈出…

2026-01-22