网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌AI掌舵人点赞!清华姚班校友新研究突破,现双双入职Meta

2025-11-21来源:快讯编辑:瑞雪

谷歌AI掌门人Jeff Dean近日点赞了一项突破性研究,这项由清华姚班校友钟沛林团队主导的嵌套学习(Nested Learning,简称NL)范式,为解决大语言模型长期存在的灾难性遗忘问题提供了新思路。研究团队提出的Hope模型在语言建模与长上下文任务中展现出显著优势,相关论文已被NeurIPS 2025接收。

传统深度学习模型采用扁平化参数更新模式,通过堆叠网络层数或扩大模型规模提升性能,但这种"暴力堆参"的方式已逐渐触及瓶颈。研究指出,当前主流的Transformer架构本质上是NL范式的简化版本,其线性层结构未能充分发挥多层级协同的潜力。NL范式借鉴人类大脑的记忆机制,将模型重构为嵌套式优化体系,不同层级以差异化频率更新,实现短期记忆与长期规律的分层管理。

该研究提出三大核心创新:深度优化器通过神经网络预判梯度变化,替代传统优化器的固定公式;自我修改模型使架构在训练中自主调整参数,无需人工干预;连续记忆系统将二元记忆结构升级为多尺度记忆链,不同模块分别处理实时细节与长期规律。这些创新最终凝聚为Hope模型,在760M至1.3B参数规模下,其语言建模能力与推理水平均超越Transformer等主流模型,在Wiki文本困惑度、物理常识推理等指标上表现尤为突出。

这项研究的背后站着一位特殊的清华姚班校友——钟沛林。这位2016届毕业生在高中时期已是国际信息学竞赛的明星选手,2012年代表雅礼中学夺得IOI金牌,与发小艾雨青并称"雅礼双子星"。哥伦比亚大学博士毕业后,他加入谷歌纽约研究院担任算法科学家,期间主导了嵌套学习范式的研究。如今这对双子星已先后入职meta,分别担任AI科学家与软件工程师,继续在人工智能领域开拓新方向。

嵌套学习范式的提出标志着深度学习架构的范式转移。通过模拟人类认知机制,该研究为模型持续学习、长上下文推理等难题提供了全新解决方案。当AI模型从静态计算网络进化为分层协作的智能系统,或许将开启真正具备终身学习能力的通用人工智能新时代。

OpenAI发布GPT-5.1:沟通更自然,情绪价值拉满,付费用户可优先体验
此次推出的GPT5.1包含GPT-5.1Instant和GPT‑5.1Thinking两个模型,前者是一个常用模型,OpenAI介绍称,该模型更温暖、智能且更善于遵循用户指令,且在回答具挑战性的问题之前可以…

2025-11-21

阿里千问APP公测版上线,免费开放,携生活场景生态力战ChatGPT
当地时间11月12日,OpenAI 正式官宣推出新一代旗舰模型GPT-5.1 系列,官方表示此次升级旨在“让ChatGPT 更智能,对话体验更有趣”。阿里集团董事兼首席执行官吴泳铭表示,大模型是下一代操作系…

2025-11-21

华为Mate70价格下探至清仓档,麒麟芯+直屏,新机前夕入手正当时?
相信即使不怎么关注手机行业的人,现在也应该注意到了华为Mate80将于11月25号发布的消息,毕竟华为手机是国产手机中的代表,而Mate系列旗舰又是华为旗舰的代表,并且每年都能带来一些惊喜,所以即使热度没有苹…

2025-11-21

大疆Action 6登场:运动影像升级,高频运动者值得入手吗?
从Action6的参数来看,大疆明显是想把运动相机做的更像相机,但其核心本质仍然是一台“记录运动的工具”,当然你也可以选择花799元购买Osmo Action 6微距镜来实现近距离拍摄和景深效果,但同样的…

2025-11-21