网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌Gemini 2.5 Flash突破性发布:成本大幅降低,性能依旧强劲

2025-04-18来源:ITBEAR编辑:瑞雪

近期,科技巨头谷歌推出了一款名为Gemini 2.5 Flash的混合推理模型,该模型凭借独特的“思考预算”调节功能,在保持卓越性能的同时,实现了成本的大幅缩减。

据悉,在闭源思考模式下,Gemini 2.5 Flash的处理成本仅为每百万tokens 0.6美元,与全功能思考模式下的3.5美元相比,成本降低了惊人的600%。值得注意的是,即便是以基础模式运行,该模型的表现也超越了其前代产品Gemini 2.0 Flash。

在性能评估方面,Gemini 2.5 Flash在大模型排行榜上取得了显著成绩,以1392分的ELO评分紧随GPT-4.5-preview之后,位列第二,与Grok-3的表现不相上下。这一成绩充分展示了该模型在AI领域的强劲实力。

在具体任务测试中,Gemini 2.5 Flash同样表现出色。在GPQA知识问答中,通过分配24K的思考预算,模型性能提升了6%。而在LiveCodeBench代码基准测试中,当思考预算为16K时,模型达到了最佳表现。这些测试结果进一步验证了该模型在复杂任务处理方面的能力。

对比测试结果显示,Gemini 2.5 Flash在多模态推理和数学任务上的表现明显优于Claude 3.7 Sonnet,其综合性能与OpenAI最新的o4-mini模型相当。在模拟人类综合能力的“人类最后一次考试”基准测试中,该模型以12.1%的高分位列第二,再次证明了其强大的综合能力。

Gemini 2.5 Flash的创新之处在于其“思考预算”机制,这一机制使得用户可以根据实际需求调整模型的思考深度和成本,从而在性能与成本之间实现了完美的平衡。这一创新为AI应用开发提供了更加灵活和经济的选择,有助于推动AI技术的普及和发展。

阿里通义App焕新升级更名千问 5.0.0版本携三大核心能力强势登场
今日,阿里旗下通义App今日发布更新,名称正式变更为千问App,版本号为5.0.0。 在版本 5.0.0中,千问强调其核心能力包括:“对话问答”“智能写作”“全能相机”三大模块。 据知情人士透露,阿里巴巴计…

2025-11-15

谷歌前工程师再创业!AI数据分析新锐WisdomAI获英伟达等3.55亿融资
WisdomAI面向企业客户推出了AI驱动的对话式商业智能(BI)平台,提供AI数据分析业务,用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称:“过去的BI只提供被动的、静态的仪表板,而Ag…

2025-11-15

百度世界大会发布AI新成果:文心5.0、昆仑芯升级,萝卜快跑领跑全球
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度世界大会亮点频出:文心5.0等成果发布,AI重构业务引领生产力革新
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

乌镇峰会:前沿科技碰撞,共绘网络空间命运共同体数智新蓝图
“非洲互联网之父”、加纳科网董事长尼·奎诺表示,像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间;世界知识产权组织总干事邓鸿森表示,乌镇峰会为我们提供全球对话与合作的契机,这种对话与合作不仅是…

2025-11-13