网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌Gemini 3 Deep Think大模型升级:聚焦科研工程,多领域能力再提升

2026-02-14来源:互联网编辑:瑞雪

谷歌近日宣布对旗下人工智能模型Gemini 3 Deep Think进行重大升级,推出专为科学、研究与工程领域设计的"推理模式"。这一版本由谷歌工程师与多领域科研人员联合开发,旨在解决真实科研场景中普遍存在的复杂问题,包括边界模糊、多解并存以及数据不完整等挑战。

在应用范围方面,更新后的Deep Think自2月12日起通过Gemini应用向Google AI Ultra订阅用户开放。同时,谷歌首次通过Gemini API向特定研究人员、工程师和企业开放"早期访问计划",并设置申请通道招募测试用户。这一举措标志着该技术开始从实验室走向实际应用场景。

性能测试显示,新版模型在数学与编程领域表现突出。在不借助外部工具的情况下,该模型在终极人类考试(Humanity's Last Exam)中取得48.4%的成绩,在ARC-AGI-2测试中达到84.6%(经ARC Prize Foundation验证),在Codeforces编程竞赛基准中获得3455的Elo评分,更在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水平。这些数据表明其推理能力已接近人类顶尖水平。

除计算领域外,模型在自然科学方面同样展现优势。在2025年国际物理奥林匹克与国际化学奥林匹克模拟笔试中,该模型均取得金牌级成绩,并在理论物理基准测试CMT-Benchmark中获得50.5%的得分。这些突破使其成为首个在多学科奥赛级别测试中均表现优异的人工智能系统。

谷歌强调,Deep Think的研发不仅关注基准测试分数,更注重实际科研与工程应用。该模型可协助研究人员解析复杂数据集,帮助工程师通过代码构建物理系统模型。通过Gemini API的早期访问计划,谷歌希望将这项技术推广至科研机构和工业界,解决真实世界中的技术难题。目前,首批测试用户已开始在气候建模、新材料开发等领域展开应用探索。

字节跳动再发力:豆包2.0大模型及Seedance 2.0视频生成模型齐发布
目前,豆包2.0 Pro已在豆包App、电脑端和网页版上线,用户选择“专家”模式即可对话体验;豆包2.0 Code接入了AI编程产品TRAE;面向企业和开发者,火山引擎也已上线豆包2.0系列模型API服务。…

2026-02-14

石头科技新专利亮相:驱动结构革新引领智能清洁设备迈向新高度
这项技术突破不仅展示了石头科技在智能清洁领域的深厚技术积累,更为其产品的持续迭代提供了坚实的技术支持。石头科技通过持续的技术迭代与生态布局,不仅巩固了其在扫地机器人领域的领先地位,更在全屋清洁解决方案领域开辟…

2026-02-14

科创人工智能ETF国泰(589110)份额规模双增,2月13日微涨成交额近1840万
2月13日,国泰上证科创板人工智能ETF(589110)收盘涨0.19%,成交额1839.16万元。 科创人工智能ETF国泰(589110)成立于2025年9月26日,基金全称为国泰上证科创板人工智能交易型…

2026-02-14

2026年一季度,萝卜快跑赴迪拜“烤”验:极限环境下能否打通无人驾驶商业路?
迪拜夏季地表温度常突破50℃,沙尘天气频繁,对传感器、电池和系统稳定性都是巨大挑战。看到这,可能你会好奇:这种技术到底有多强?行业平均是15%-20%,这意味着萝卜快跑的技术已经领先一步。首批50辆定制化车辆…

2026-02-13

三星提前布局2026折叠机市场,One UI 9测试固件为Fold 8与Flip 8适配
IT之家 2 月 13 日消息,消息源 Tarun Vats 昨日(2 月 12 日)在 X平台发布推文,基于三星服务器发现的测试固件,三星已开始为 Galaxy Z Fold8、Galaxy Z Flip…

2026-02-13

石头科技再获突破!“爬楼装置”专利为智能清洁设备开辟新路径
这一新专利的获得不仅标志着公司在自主研发方面的进一步突破,也为智能清洁设备的未来发展指明了方向。石头科技的这一新专利正是顺应了这一趋势,标志着公司在智能清洁设备领域的进一步深化。 总的来说,石头科技的“爬楼装…

2026-02-13