网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

Gemini 3正式登场:多模态推理霸榜,AI新格局或将重塑

2025-12-03来源:快讯编辑:瑞雪

谷歌最新发布的Gemini 3智能模型引发全球科技界震动。这款被定义为"通往AGI重要一步"的模型,在发布前就因开发者负责人一条仅含"Gemini"的推文引爆社交媒体,甚至导致推特平台多次出现访问故障。尽管Cloudflare事后澄清故障原因,但网友仍戏称这是"史上最成功的模型预热"。

在基准测试中,Gemini 3 Pro以1501分的Elo评分登顶LMArena排行榜,在Humanity's Last Exam(37.5%)和GPQA Diamond(91.9%)等核心指标上全面超越前代及Claude、GPT等竞品。数学能力方面,该模型在MathArena Apex取得23.4%的突破性成绩,重新定义了前沿模型的标准。多模态处理能力同样惊艳,在解析科学图表和视频流的任务中分别获得81%和87.6%的高分,事实准确性指标SimpleQA Verified更达到72.1%。

深度思考模式(Deep Think)的推出成为最大亮点。测试数据显示,该模式在Humanity's Last Exam(41.0%)和GPQA Diamond(93.8%)的表现优于基础版,在代码执行测试ARC-AGI-2中取得45.1%的得分。这种能力提升使模型能自主规划复杂任务,例如在模拟售货机经营测试中,通过长周期管理实现更高投资回报,全程保持决策连贯性。

开发者生态迎来重大革新。新推出的Google Antigravity平台将智能体开发提升至新维度,开发者可授权AI自主操作编辑器、终端和浏览器。该平台整合了Gemini 2.5 Computer Use浏览器控制模型和Nano Banana图像编辑模型,形成完整的开发工具链。在WebDev Arena测试中,Gemini 3以1487分领跑,Terminal-Bench 2.0测试取得54.2%的成绩,编码代理性能测试SWE-bench Verified得分达76.2%。

实际应用场景展现惊人潜力。用户上传匹克球比赛视频后,模型能分析技术缺陷并制定训练计划;学习复杂科学概念时,可生成交互式记忆卡片和可视化代码;烹饪爱好者能通过翻译手写食谱,生成多语言数字版本。搜索中的AI模式引入沉浸式视觉布局,用户查询RNA聚合酶工作原理时,系统会即时生成动态模拟界面。

定价策略采用分级模式,200k tokens以下任务输入/输出价格为每百万token 2美元/12美元,超过部分则升至4美元/18美元。深度思考模式将作为Google AI Ultra订阅专属功能,预计未来几周内上线。技术细节显示,这个基于MoE架构的模型使用TPU从头训练,具备1M输入和64k token输出能力。

市场反应印证行业期待。在X平台发起的"2026年最佳大模型"投票中,Gemini系列获得压倒性支持。官方数据显示,AI Overviews月活用户达20亿,Gemini应用突破6.5亿月活,云客户中超70%使用其生成式模型,开发者数量突破1300万。这场始于Bard仓促发布的转型,经过合并DeepMind、召回创始人等重大调整,正显现出战略成效。

OpenAI入股Thrive Holdings,发力企业级AI会计与IT服务领域
新榜讯 12月1日消息,OpenAI正式宣布入股ThriveHoldings,其目标是加速企业级人工智能的普及与应用,初期聚焦于会计和IT服务领域。据悉,OpenAI将在Thrive Holdings旗下公…

2025-12-03

华为Mate80系列新机到手,首件事必领Petal One会员“全家桶”!
直到有了Petal One悦享套餐,我的生活是想看《浪浪山小妖怪》打开华为视频我就看,而且还是AiMax观影效果,无广畅看!没有换新机的需求也别遗憾,现在订阅Petal One悦享套餐或尊享套餐,送你一年…

2025-12-03

电钢琴怎么选?十款高口碑电钢琴深度解析,助你找到心仪之选!
卡瓦依KDP120GR是一款功能齐全、外观精美的立式电钢琴,无论是成人初学者还是儿童学琴,甚至是专业家用需求,它都能提供良好的音质和演奏体验。 雅马哈P225WH是一款 精巧型数码电钢琴,以其洁白的外观和…

2025-12-03