网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

新加坡AI计划战略转向:弃Meta选阿里千问 破解东南亚语言适配难题

2025-11-26来源:天脉网编辑:瑞雪

新加坡国家人工智能计划(AISG)近日完成了一次重要战略调整,在东南亚语言大模型开发领域选择与中国科技企业展开深度合作。其最新发布的“Qwen-SEA-LION-v4”模型采用阿里巴巴通义千问(Qwen)开源架构,在东南亚语言处理能力评估中登顶开源榜单,标志着区域性AI技术格局发生显著变化。

传统西方开源模型在东南亚市场遭遇适配瓶颈。以meta的Llama系列为代表的模型虽在通用性能上领先,但其英语优先的设计理念导致处理印尼语、泰语等区域语言时效率低下。特别是缅甸语等非拉丁语系文字,因缺乏原生支持,需要额外开发适配层,显著增加了本地化开发成本。AISG团队经过技术评估发现,依赖硅谷技术路线难以满足东南亚多语言环境的复杂需求。

阿里巴巴的Qwen3架构展现出独特优势。该模型在预训练阶段即融入36万亿token的多元数据,覆盖119种语言体系,形成原生多语言处理能力。这种设计使模型不仅能识别东南亚文字符号,更能从语法结构层面理解语言逻辑。AISG基于此架构开发的Sea-Lion v4特别优化了分词技术,采用字节对编码(BPE)方案精准切分泰语、缅甸语等无空格语言,翻译准确率较西方模型提升40%,推理速度提高25%。

商业落地层面的考量成为合作关键推手。东南亚中小企业占企业总数的97%,普遍缺乏高端算力资源。Qwen-Sea-LION-v4通过模型压缩技术,可在32GB内存的消费级设备上运行,使开发者无需依赖云端服务即可本地部署。这种“轻量化部署”特性与区域市场形成完美契合,相较需要H100集群的西方方案,部署成本降低超过80%。

技术合作呈现双向赋能特征。阿里提供通用推理框架的同时,AISG贡献了经过严格清洗的1000亿东南亚语言token数据集。该数据集东南亚内容占比达13%,是Llama2数据集的26倍,且完全规避版权争议。这种数据与技术的深度融合,使Sea-Lion v4在Sea-Helm评估中以显著优势领跑同量级开源模型,在机器翻译、语义理解等核心指标上超越西方竞品。

此次技术合作引发行业连锁反应。马来西亚数字部随即宣布将基于该模型开发国家级政务AI系统,泰国朱拉隆功大学已启动医疗问诊场景的本地化训练。技术观察家指出,这种“东方技术+区域数据”的合作模式,可能重塑全球AI技术分布格局,特别是在多语言处理领域形成新的技术标准。

谷歌阿里破局AI转型困境:拆壁垒、找路径,领跑全球靠什么?
老庐觉得,大公司普遍存在“山头主义”的沉疴,旧业务的利润绑架、部门间的协作壁垒,往往让好技术烂在实验室里,谷歌整合研发团队、阿里调整组织架构,本质都是拆掉“组织墙”,这也印证了一个道理:AI转型不是技术问题…

2025-11-26

B站陈睿北大分享:兴趣驱动内容生态,助力优质内容与创作者共成长
谈及好内容的标准,陈睿提出四大核心特质:一是真诚触心,能引发用户情感共鸣;二是创意独特,具备差异化表达;三是价值导向,让用户有所收获;四是正向情感,传递积极向上的能量。 在互动环节,针对师生关心的“中长视频…

2025-11-26

新加坡AI战略调整弃Meta选阿里千问 中国开源模型影响力再升级
11月25日消息,据新加坡媒体报道,新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源A…

2025-11-26