清华姚班校友钟沛林新研究获Jeff Dean点赞，AI领域再掀创新浪潮-网界

谷歌AI负责人Jeff Dean近日点赞了一项突破性研究，这项由清华姚班校友钟沛林团队提出的新范式——嵌套学习（Nested Learning，NL），为大语言模型领域长期存在的灾难性遗忘问题提供了创新解决方案。研究论文已被NeurIPS 2025接收，其核心成果Hope模型在多项基准测试中超越了Transformer等主流架构。

传统深度学习模型依赖堆叠网络层数和扩大参数规模提升性能，但这种模式已逐渐触及瓶颈。研究团队指出，大语言模型普遍存在“顺行性遗忘”问题：预训练完成后难以吸收新知识，仅能依赖有限上下文窗口或固化参数，无法像人类一样动态积累知识。嵌套学习通过模拟人脑认知机制，将模型重构为多层级的优化系统，每个层级拥有独立的上下文流和更新频率，实现信息的高效处理与存储。

论文揭示，当前广泛使用的Transformer架构本质上是嵌套学习的简化版本。其线性层结构仅保留了NL的多层级协同中的单一层级，未能充分发挥分层记忆的优势。研究团队提出的Hope模型基于NL范式，在语言建模和长上下文记忆任务中表现优异，参数规模从760M到1.3B的版本均显著超越Transformer、RetNet等基线模型，在Wiki文本困惑度、物理常识推理等指标上展现出更强的语言理解和推理能力。

该研究的核心创新包含三大模块：深度优化器通过预处理机制识别梯度性质，用神经网络替代传统线性记忆，实现灵活调参；自我修改模型允许架构在训练中自主调整参数，无需人工干预即可适配新领域数据；连续记忆系统将传统二元记忆结构升级为多尺度记忆链，不同模块按不同频率更新，分别存储短期细节与长期规律。这些创新使模型具备类似人类的分层记忆管理能力。

这项研究的领军人物钟沛林2016年毕业于清华姚班，2021年获得哥伦比亚大学计算机博士学位后加入谷歌纽约研究院。他的学术轨迹始于中学时期的竞赛生涯：2012年代表雅礼中学夺得国际信息学奥林匹克竞赛金牌，与同校发小艾雨青并称“双子星”，两人均保送至清华姚班。如今，这对昔日搭档已先后入职meta，分别担任AI科学家与软件工程师，继续在人工智能领域深耕。

AI To C新变局：阿里千问与谷歌Gemini 3的差异化突围之路

当然，尽管谷歌和阿里巴巴这两家巨头都依靠AI实现逆袭，但本质上两者却走出了截然不同的路径，谷歌以封闭的Gemini模型坚守信息入口的核心优势，而阿里则用开源的Qwen模型和庞大的商业生态，开辟了一条“会办事…

2025-11-26

星闪SLE技术：华为2025园区网络物联数采的高效可靠新方案

星闪SLE技术应运而生，旨在弥补传统短距通信技术在连接密度、带宽、时延与功耗等综合诉求上的短板，适配智能家居、智能制造、电力行业等多场景物联数据采集需求。WLAN星闪SLE物联数采方案采用“AC+FIT A…

2025-11-26

原“华为天才少年”彭志辉履新上纬新材董事长跨界领航新征程

上纬新材表示，公司管理团队由在公司全职工作的田华、周斌(联席CEO兼CTO)、章彪(CFO)、李元(董事会秘书)组成；彭志辉、姜青松、钮嘉仍在智元创新(上海)科技有限公司任职，不在公司担任除董事以外的其他行…

2025-11-26

荣耀12月新品来袭！多款大电池新机配置曝光，续航实力引期待

这位博主表示，这些手机的处理器各有不同，分别搭载高通骁龙 7 / 骁龙 8 和联发科天玑 8系芯片，其中的大屏中端产品线没有像竞品那样全面普及金属中框和 3D 超声波指纹，最大的优势还是续航。荣耀 GT…

2025-11-26

探秘阿里研学：解锁数字未来与智慧商旅的创新密码
2025-11-26

余承东：鸿蒙终端设备破2700万日均增超10万 2年走完他系10年路

2025-11-26

智元机器人高层变动：“93年天才少年”彭志辉任总裁兼CTO，田华出任CEO

2025-11-26

大众汽车合肥新测试车间启用构建完整研发闭环加速本土化功能开发

2025-11-26