网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

清华姚班校友钟沛林新研究获Jeff Dean点赞,AI领域再掀创新浪潮

2025-11-26来源:快讯编辑:瑞雪

谷歌AI负责人Jeff Dean近日点赞了一项突破性研究,这项由清华姚班校友钟沛林团队提出的新范式——嵌套学习(Nested Learning,NL),为大语言模型领域长期存在的灾难性遗忘问题提供了创新解决方案。研究论文已被NeurIPS 2025接收,其核心成果Hope模型在多项基准测试中超越了Transformer等主流架构。

传统深度学习模型依赖堆叠网络层数和扩大参数规模提升性能,但这种模式已逐渐触及瓶颈。研究团队指出,大语言模型普遍存在“顺行性遗忘”问题:预训练完成后难以吸收新知识,仅能依赖有限上下文窗口或固化参数,无法像人类一样动态积累知识。嵌套学习通过模拟人脑认知机制,将模型重构为多层级的优化系统,每个层级拥有独立的上下文流和更新频率,实现信息的高效处理与存储。

论文揭示,当前广泛使用的Transformer架构本质上是嵌套学习的简化版本。其线性层结构仅保留了NL的多层级协同中的单一层级,未能充分发挥分层记忆的优势。研究团队提出的Hope模型基于NL范式,在语言建模和长上下文记忆任务中表现优异,参数规模从760M到1.3B的版本均显著超越Transformer、RetNet等基线模型,在Wiki文本困惑度、物理常识推理等指标上展现出更强的语言理解和推理能力。

该研究的核心创新包含三大模块:深度优化器通过预处理机制识别梯度性质,用神经网络替代传统线性记忆,实现灵活调参;自我修改模型允许架构在训练中自主调整参数,无需人工干预即可适配新领域数据;连续记忆系统将传统二元记忆结构升级为多尺度记忆链,不同模块按不同频率更新,分别存储短期细节与长期规律。这些创新使模型具备类似人类的分层记忆管理能力。

这项研究的领军人物钟沛林2016年毕业于清华姚班,2021年获得哥伦比亚大学计算机博士学位后加入谷歌纽约研究院。他的学术轨迹始于中学时期的竞赛生涯:2012年代表雅礼中学夺得国际信息学奥林匹克竞赛金牌,与同校发小艾雨青并称“双子星”,两人均保送至清华姚班。如今,这对昔日搭档已先后入职meta,分别担任AI科学家与软件工程师,继续在人工智能领域深耕。

AI To C新变局:阿里千问与谷歌Gemini 3的差异化突围之路
当然,尽管谷歌和阿里巴巴这两家巨头都依靠AI实现逆袭,但本质上两者却走出了截然不同的路径,谷歌以封闭的Gemini模型坚守信息入口的核心优势,而阿里则用开源的Qwen模型和庞大的商业生态,开辟了一条“会办事…

2025-11-26

星闪SLE技术:华为2025园区网络物联数采的高效可靠新方案
星闪SLE技术应运而生,旨在弥补传统短距通信技术在连接密度、带宽、时延与功耗等综合诉求上的短板,适配智能家居、智能制造、电力行业等多场景物联数据采集需求。WLAN星闪SLE物联数采方案采用“AC+FIT A…

2025-11-26

原“华为天才少年”彭志辉履新上纬新材董事长 跨界领航新征程
上纬新材表示,公司管理团队由在公司全职工作的田华、周斌(联席CEO兼CTO)、章彪(CFO)、李元(董事会秘书)组成;彭志辉、姜青松、钮嘉仍在智元创新(上海)科技有限公司任职,不在公司担任除董事以外的其他行…

2025-11-26

荣耀12月新品来袭!多款大电池新机配置曝光,续航实力引期待
这位博主表示,这些手机的处理器各有不同,分别搭载高通骁龙 7 / 骁龙 8 和联发科天玑 8系芯片,其中的大屏中端产品线没有像竞品那样全面普及金属中框和 3D 超声波指纹,最大的优势还是续航。 荣耀 GT…

2025-11-26