谷歌Gemini核心团队爆料：Scaling Law演变中，AI未来将转向精细模式-网界

在人工智能领域，谷歌始终站在技术前沿，其一举一动都备受瞩目。近期，Google DeepMind的Gemini预训练负责人Sebastian Borgeaud在一场访谈中，透露了未来大模型预训练领域的重大发展方向，引发了行业内的广泛关注。

Sebastian Borgeaud指出，在未来一年内，大模型预训练将在两个关键方向取得重大技术创新，分别是提升长上下文处理效率以及进一步扩展模型上下文长度。这一预测并非空穴来风，而是基于他们团队在相关领域的深入研究和探索。他透露，最近在注意力机制方面，团队有了一些非常有趣的发现，这些发现极有可能在未来几个月内重塑研究方向，为模型性能的提升带来新的突破。

Sebastian还强调了一个重要观点：“Scaling Law并未消亡，只是正在演变。”这一观点打破了传统认知，为AI发展注入了新的思考。作为Gemini 3的预训练负责人，Sebastian首次接受博客采访，深入剖析了Gemini 3背后的研发思路。他表示，如今的工作不再局限于“训练模型”，而是致力于构建一个完整的系统。这种转变看似简单，实则是一个根本性的认知升级。

Gemini 3之所以能实现巨大的性能飞跃，背后是无数细微改进的聚合。Sebastian提到，庞大团队日复一日地发现并优化各种“旋钮”，才带来了如今的成果。同时，他也指出AI发展范式正在发生潜在转移。过去，数据似乎取之不尽，我们可以随意扩大数据集；但现在，我们正逐渐步入“数据有限”的时代。这意味着未来的AI必须学会更高效地利用有限的数据资源，构建更复杂的系统工程。

这一转变将促使整个行业从“大力出奇迹”的粗放模式，转向“精雕细琢”的精细模式。未来的竞争焦点将不再是谁拥有更大的数据中心，而是谁的学习算法更高效、模型架构更优雅、谁能从有限数据中提取更多智慧。Gemini 3采用的混合专家模型MoE，就代表了大型语言模型（LLM）发展的清晰路径：从单纯追求“大”，转向追求“大而高效，大而智能”。

展望未来几年的技术前沿，Sebastian指出了几个激动人心的方向。首先是长上下文处理能力。Gemini 1.5已经展现了超长上下文能力带来的变革，而Sebastian预测，未来一年左右，在使长上下文更高效、进一步扩展上下文长度方面将会有更多创新。超长上下文将使模型变成一个真正的数字工作台，能够同时载入整个代码库、多篇科研论文、长时间对话历史，并进行连贯的分析、推理和创作，为复杂任务和深度研究提供前所未有的可能。

其次是注意力机制的进化。Sebastian特别提到，团队在注意力机制上有了一些真正有趣的发现，这将塑造未来几个月的大量研究。作为当前大模型的基石，注意力机制仍有巨大的改进空间，更高效、更强大或具备新特性的注意力机制有望从底层显著提升模型的理解、推理和计算效率。

检索能力的回归也是重要方向之一。Sebastian早期主导的“Retro”项目，研究让模型在训练和推理时检索外部知识库，而非将所有知识死记硬背在参数中。他认为这一方向远未过时，未来模型可能将检索与推理更原生地结合，动态地从海量知识源中获取信息进行思考，突破参数规模的知识容量限制。

效率与成本的“革命”也日益凸显。随着用户激增，模型的部署和服务成本变得至关重要。未来的研究将不仅追求性能峰值，还必须关注如何让强大模型变得“便宜又好用”。

与此同时，Jeff Dean、Noam Shazeer、Oriol Vinyals三位谷歌顶级科学家的对谈也传递出重要信息。作为Transformer的开创者，Noam Shazeer回归谷歌后，态度发生了明显变化。他不再像过去那样激进地追求“颠覆”，而是多次谈到研发节奏、系统稳定性以及长期运行等问题。他指出，现在的模型并不缺“聪明”，缺的是持续思考和在复杂任务中反复修正的能力。大模型的规模依然重要，但不再是决定一切的唯一变量。

Noam提到的“慢思考”理念，并非简单地放慢研发速度，而是反复权衡值不值、贵不贵、能不能被规模化复制。智能不再是一项抽象的能力，而是一项需要长期投入的工程开销，需要和CPU、硬盘等资源一起纳入成本考量。这一理念的转变，使得过去衡量AI的标准，如Benchmark逐渐失效。三位科学家在会议中没有表现出对榜单的兴奋，而是更关注模型是否可靠、是否具备迁移能力、是否能在复杂任务中持续自我修正。

在这场对谈中，“System”一词频繁出现。Noam和Jeff在描述Gemini时，刻意强调它是一个可以长期运行、不断迭代的“系统”，而非“一个更强的模型”。“模型”更像是一次性的成果，而“系统”则更像基础设施，关注稳定性、可扩展性以及错误修复能力。对于注重架构设计、研发节奏和工程约束的科学家们来说，一个系统能否稳健运行十年、二十年，远比某一次响应速度有多快更为重要。在他们眼中，Gemini不是胜利者的奖品，而是一种“长期可用”的智能形态。

国盾量子人事变动：应勇暂代董事长首次布局EDA软件赛道

2025-12-21

2026年小程序技术选型指南：从痛点出发，解锁靠谱技术伙伴新选择

广州一家原创服装品牌“织梦坊”就利用呱呱赞的电商模板，在三个月内将线上销售额提升了200%，其店主反馈：“模板设计感强，营销工具齐全，操作特别简单，完全超出了我们对这个价位服务的预期。”智简引擎的目标是让商家…

2025-12-21

iOS 26.2正式版已至！iOS 26.3测试版将“暂歇” 26.4新功能值得期待

苹果在上周向用户推送了 iOS 26.2 正式版系统更新，同时也按照惯例，现在则关闭了上一个 iOS 26.1 版本的系统验证。目前，已经升级到 iOS 26 系统的 iPhone 用户，可选择的系统版本…

2025-12-21

宇树机器人王力宏演唱会秀高难度空翻，获马斯克盛赞引热议

2025-12-20

马斯克点赞！宇树G1机器人王力宏演唱会首秀伴舞引关注

近日，王力宏演唱会首次引入宇树科技G1人形机器人伴舞。视频显示，宇树科技G1人形机器人与王力宏共同演绎《火力全开》，实现了全球首个演唱会机器人舞台。此次参与演唱会的机型还经过舞台场景优化，宇树团队通过多智…

2025-12-20

阿里字节“双雄”竞争：谣言背后是行业焦虑，AI赛道需理性前行

阿里系构建了千问、夸克 AI、蚂蚁阿福等产品协同矩阵，既用通用型 AI抢占用户入口，又通过蚂蚁阿福在医疗健康等高壁垒垂类建立护城河；字节则依托抖音生态为豆包导流，同时在内容生成、日常助手等场景持续发力。 …

2025-12-20

马斯克再发声：驾驶非自动驾驶燃油车如同“骑马用翻盖手机”过时

2025-12-20