网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌发布Gemma 4开放模型系列:端侧优化让AI Agent离线畅行无阻

2026-04-03来源:快讯编辑:瑞雪

谷歌近日正式推出新一代开放模型系列Gemma 4,宣称这是其迄今为止最智能的开放模型。该系列专为复杂推理场景和智能体工作流设计,采用Apache 2.0商业许可证开源,包含四种不同规格的通用模型:20亿参数的高效版(E2B)、40亿参数的高效版(E4B)、260亿参数的混合专家模型(MoE)以及310亿参数的稠密模型(31B)。

在移动端和物联网设备领域,E2B与E4B模型通过优化推理时的参数激活量实现低功耗运行。前者仅激活约20亿参数,后者激活约40亿参数,这种设计显著降低了内存占用和电量消耗。目前这两个模型已与谷歌Pixel团队、高通、联发科等硬件厂商达成合作,支持在手机、树莓派、NVIDIA Jetson Nano等设备上实现近乎零延迟的离线运行。

26B MoE模型的创新之处在于其动态参数激活机制。在执行推理任务时,该模型仅需激活38亿参数,既保持了高运算效率,又完整保留了大型模型的知识储备。这种设计使其在处理复杂任务时,既能快速响应又能提供深度分析。

针对开发者和研究人员的需求,26B与31B模型专门优化了消费级GPU的兼容性。这使得用户无需依赖云端服务,即可将个人工作站转化为具备本地AI处理能力的服务器,特别适合学生、研究人员进行深度学习实验和模型开发。

谷歌DeepMind团队的研究人员Clement Farabet和Olivier Lacombe透露,通过优化算法架构,Gemma 4系列实现了"单位参数智能"的显著提升。以31B稠密模型为例,其在行业标准评测的开源模型榜单中已跻身前三,展现出超越参数规模的性能表现。

在智能体开发方面,Gemma 4系列实现了原生支持能力的大幅升级。相较于前代需要额外调整才能实现工具交互的模型,新一代产品直接集成了函数调用、结构化JSON输出、系统指令执行等功能,并支持超过140种语言。这种设计使开发者能够直接构建自主智能体,实现与第三方工具的无缝对接和多步骤任务规划。

阿里巴巴研究揭秘:AI训练中极少数关键位置驱动模型性能飞跃式提升
研究团队通过深入分析发现,在使用可验证奖励的强化学习方法训练大语言模型时,超过98%的词汇位置几乎没有发生任何变化,但就是剩下的不到2%的关键位置,却承载着模型性能提升的全部秘密。 A:研究发现在使用可验证奖…

2026-04-03

波司登高德康:五十年坚守与创新,引领中国品牌迈向高质量未来
“国潮热的底色是品质,核心是创新,灵魂是文化”这一观点,凝练了波司登五十年发展历程的精髓,亦揭示了中国品牌在新时代的进取方向。他观察到,消费市场正从“基本满足”向“品质提升”转型,情感价值与情绪价值已成为影响…

2026-04-03