在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以"更懂你的AI"为主题,推出讯飞星火大模型最新技术升级及系列创新产品,全面展示AI技术从实验室走向产业应用的实践路径。董事长刘庆峰在演讲中指出,AI技术要实现规模化落地,必须突破自主可控、软硬一体、行业纵深和个性化服务四大核心瓶颈,目前已在300余个智能体应用中验证成效,其中"星火行业分析师"成为国内首个通过工信部认证的行业分析AI工具,在大数据分析师考试中以92分超越85%的人类考生。

发布会上最受瞩目的讯飞星火X1.5大模型正式亮相,该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,在保持数学能力国际领先的同时,推理效率较前代提升100%。其多语言支持覆盖130余种语言,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言市场表现尤为突出。技术团队突破性解决了国产算力平台下的两大难题:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃。更引人注目的是全球首发的非自回归语音架构,通过并行输出技术使推理成本降低520%,效果提升16%。
在软硬一体化领域,科大讯飞推出多款创新产品。智能办公本X5搭载上4下4环八麦克风阵列,抗噪能力超越iPhone 17 Pro,在80分贝环境下识别准确率达95.08%;AI翻译耳机采用单耳三麦融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0的强降噪模式在90分贝环境中仍保持98.69%的识别率。智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已在19家车企量产,出货量突破百万台。教育领域创新同样显著,AI黑板配备全球首款圆偏类自然光护眼屏,视觉疲劳降低50%,显示角度达130度;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。

多模态交互技术迎来重大突破,数字人导览"小飞"现场演示了八项核心能力:远场麦克风识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆及情感语义分析。其中个性化记忆库可综合用户长期画像、近期反馈和短期对话,实现真正的"懂你"服务;百变声音复刻技术仅需1秒录音即可复刻任意音色,支持自定义声音风格。刘庆峰强调:"超拟人多模态交互将成为家庭AI的标准配置,让技术真正具备情感温度。"
应用场景覆盖全面升级,教育领域构建了包含4000余个标签的错因分析体系,通过智能批阅机和教师助手实现"小时级"教学闭环;医疗领域"智医助理医院版1.0"达到三甲医院主任级诊疗水平,人机协同使诊断合理率提升9个百分点;智慧座舱2.0融合13个摄像头和54维记忆锚点,可实时监测5项体征指标;办公领域产品实现手写纪要与AI纪要的深度融合。情感陪伴方面,"AI星朋友"搭载4.35MOS高保真声音克隆技术,提供超过160种人设模型,能通过自学习情感模型主动发起关怀。
生态建设取得突破性进展,2025年AI开发者大赛吸引17国36,898个团队参赛,诞生4,622个垂直领域智能体。讯飞开放平台开发者突破968万,近一年新增200万,大模型企业开发者增长125%。面向开发者推出的Astron智能体平台原生支持RPA技术,提供八大行业智能体解决方案。发布会最后,科大讯飞与多国合作伙伴启动"星火点亮全球"计划,依托多语言技术和自主可控架构,为全球提供AI发展的替代方案,加速技术红利普惠共享。
