网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里云机器学习平台PAI与华东师范大学论文入选SIGIR 2022

2023-09-07来源:互联网编辑:瑞雪

近日,阿里云机器学习平台PAI与华东师范大学高明教授团队合作的论文《结构感知的稀疏注意力Transformer模型SASA》被顶会 SIGIR 2022录取。论文主导通过引入稀疏自注意力的方式来提高Transformer模型处理长序列的效率和性能,并提出了结合代码语言和结构特性的面向长代码序列的Transformer模型性能优化方法。

SIGIR是人工智能领域智能信息检索方向顶级国际会议,涉及搜索引擎、推荐系统等多个方向,该会议曾推动了面向搜索的排序模型、基于深度学习的推荐算法等人工智能领域的核心创新,在学术和工业界都有巨大的影响力。此次入选意味着阿里云机器学习平台PAI自研的稀疏注意力Transformer模型达到了业界先进水平,获得了国际学者的认可,展现了中国机器学习系统技术创新在国际上的竞争力。

那么SASA主要解决了什么问题?基于Transformer的模型在self-attention模块的复杂度随序列长度呈次方增长,多数编程预训练语言模型(Programming-based Pretrained Language Models, PPLM)采用序列截断的方式处理代码序列,从而导致上下文信息缺失。

针对以上问题,SASA设计了四种稀疏注意力模式,包括:sliding window attention,global attention,Top-k attention,AST-aware attention,在一定程度上将计算复杂度与序列长度解耦。其中sliding window和Top-k模式基于局部上下文和重要的attention交互学习表示,抽象语法树(AST)模式引入代码的结构特性,与序列上下文信息相互补足,global attention通过与序列中所有token进行交互来获取全局信息。对比CodeBERT,GraphCodeBERT等方法,SASA在多个长代码任务上取得最佳效果,同时也降低了内存和计算复杂度。

SASA技术将在开源框架EasyNLP中集成,给PAI的NLP开发者提供基于稀疏注意力机制的长序列自然语言处理能力。机器学习平台PAI面向企业客户级开发者,提供轻量化、高性价比的云原生机器学习,涵盖PAI-DSW交互式建模、PAI-Designer可视化建模、PAI-DLC分布式训练到PAI-EAS模型在线部署的全流程。

论文信息

EasyNLP开源地址:https://github.com/alibaba/EasyNLP

论文链接:https://arxiv.org/abs/2205.13730

论文名字

Understanding Long Programming Languages with Structure-Aware Sparse Attention. SIGIR 2022

论文作者

刘婷婷,汪诚愚,陈岑,高明,周傲英

赛彼思获阿里飞猪数千万战略投资 深耕AI直播赋能电商文旅行业
赛彼思公司自2024年2月成立以来,已为电商、文旅等多个行业客户提供定制化AI直播解决方案,助力企业提升直播效率与用户体验。 据悉,赛彼思已与多家知名电商平台、文旅企业建立合作关系,未来将围绕"AI+直播"…

2025-10-23

微信AI机器人客户管理系统:黑名单功能如何设置?管理策略有哪些?
黑名单功能允许企业将某些客户标记为不希望继续互动的对象,这在处理恶意骚扰、低质量互动或不符合企业服务标准的客户时非常有用。 在实际应用中,黑名单功能可以与ChatWave的其他功能相结合,如自动回复、客户分类…

2025-10-22

企业级AI大模型落地全解析:现状挑战、架构方法与未来趋势
现状方面,2025年国内AI市场规模预计超7000亿元,备案大模型超500个,覆盖通用与垂直领域,政务、金融、制造等行业渗透率较高,部署模式分私有化、混合云、公有云API,其中金融、医疗等强监管行业偏好私有化…

2025-10-22

马斯克:xAI研发的Grok 5有10%概率实现AGI 且概率持续上升
特斯拉与SpaceX首席执行官埃隆·马斯克在社交平台上发布预测,称其旗下人工智能公司xAI正在研发的Grok5大型语言模型有10%的概率实现通用人工智能(AGI),且该概率呈持续上升趋势。 这一目标与xAI…

2025-10-21