网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

蚂蚁百灵Ling-2.6-flash模型揭晓:高效推理,百万字长篇轻松生成

2026-04-22来源:天脉网编辑:瑞雪

蚂蚁集团旗下百灵团队近日宣布,其最新研发的轻量级大模型Ling-2.6-flash正式亮相。该模型此前以匿名形式在OpenRouter平台上线测试,迅速攀升至热榜首位并持续保持领先地位,日均调用量突破百亿级tokens。经过多轮优化验证,这款总参数量达104B、激活参数7.4B的Instruct模型,现已在OpenRouter与官方平台同步开放免费API调用服务。

技术团队通过架构创新实现性能突破,该模型采用混合线性注意力机制与稀疏化MoE架构,在4卡H20硬件环境下推理速度达340 tokens/s,Prefill吞吐量达到主流模型的2.2倍。特别在token效率优化方面,模型在Artificial Analysis完整评测中仅消耗15M tokens即达成目标,成本约为同类模型的十分之一。这种设计使其在长文本生成、实时交互等场景中展现出显著优势,百万字级内容可在数十分钟内完成创作。

针对Agent应用场景,研发团队构建了专项强化训练体系。通过扩展高保真交互数据集,模型在工具调用、多步骤规划等核心能力上取得突破性进展。在BFCL-V4、TAU2-bench等权威评测中,该模型与参数量更大的竞品相比,仍保持相近甚至领先的性能表现。实测数据显示,其可稳定处理需求整理、任务拆解等复杂工作流,幻觉率较前代降低37%,结果可用性显著提升。

在应用开发层面,Ling-2.6-flash展现出强大的场景适应能力。测试案例显示,模型可在1分钟内完成包含明暗模式切换、响应式设计的网站开发,并支持局部功能秒级修改。结合Kilo Code插件使用时,多子Agent协同机制使输出效率进一步提升。目前该模型已支持BF16、FP8、INT4等多种精度模式,其中INT4量化版本可在DGX Spark硬件上运行,为边缘设备部署提供可能。

当前开放的服务方案包含双重福利:首周提供完全免费的API调用,之后每日保留50万tokens免费额度,超出部分按输入0.6元/百万tokens、输出1.8元/百万tokens计费。技术社区可期待的是,该模型的BF16、FP8、INT4版本代码即将开源,配套的推理算子优化方案也将陆续公开,这为开发者自定义部署提供了重要支撑。

尽管在复杂系统开发等场景仍存在局限,但百灵团队通过持续迭代已显著改善模型稳定性。最新测试表明,在涉及中英双语切换、长程任务执行等场景时,模型的响应准确率较测试初期提升29%。技术白皮书显示,研发团队正探索通过动态注意力分配机制,进一步突破推理深度限制,在保持高效特性的同时提升复杂场景处理能力。

智慧新伙伴上线:阿里巴巴“千问小酒窝”数字人,开启AI生态融合新体验
作为阿里千问AI的统一数字人形象,这位智慧伙伴不仅在千问App中,接下来也会在阿里生态各应用中,为用户提供统一、便捷的智能体验,阿里AI生态融合持续加速。 随着生态打通的深入,除了千问App原生入口,“千问小…

2026-04-22

阿里巴巴推出生态级AI数字人“千问小酒窝” 助力阿里生态智能体验升级
凤凰网科技讯 4月22日,阿里巴巴通过微博发布生态级AI助手数字人形象——千问小酒窝。据介绍,订餐、买票、打车均能通过简单对话轻松“办事”。接下来,千问小酒窝也会出现在阿里生态各应用中,提供统一、便捷的智能体…

2026-04-22

谷歌深夜放大招!Deep Research智能体升级,MCP支持与图表生成双突破
这两款智能体首次允许开发者通过单次API调用,将开放网络数据与企业专有信息进行融合,并在研究报告中原生生成图表和信息图,同时还可通过ModelContext Protocol(MCP)连接任意第三方数据源…

2026-04-22

陈开冉:以高质量数据为基 领航企业级AI垂类赛道新征程
未来,汉数科技将持续筑牢高质量数据护城河,深耕垂直领域,以 AI OS、HanPaaS架构、垂类大模型为核心引擎,让数智员工真正走进千行百业,以技术创新驱动产业数智化变革,与所有伙伴共同见证 AI 无限可…

2026-04-22

外媒实测OPPO Find X9 Ultra:影像升级显著 拍照实力或入第一梯队
【CNMO科技消息】近日,OPPO Find X9 Ultra全球发布,有外媒对其进行了全面测评。 OPPO Find X9 Ultra外媒表示,OPPO Find X9 Ultra的核心升级集中在影像系统…

2026-04-22