网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌的人工智能语音模型将在增强现实眼镜内提供实时翻译服务

2023-03-08来源:网界科技编辑:星辉

【网界科技】3月8日消息,人工智能语音模型在全球范围内推动跨语言交流

谷歌正在朝着建立一个支持1000种不同语言的人工智能语言模型的目标迈进。这项目标对于全球范围内的语言交流和信息共享具有重要意义。

谷歌的通用语音模型(USM)是实现这一目标的关键第一步。USM是一个包含20亿个参数的语音模型系列,在1200万小时的语音和超过300种语言的280亿个句子中进行训练。去年11月,谷歌宣布计划创建一个支持全球1000种最常用语言的语言模型,并披露了USM模型。目前,USM已经支持超过100种语言,并将作为建立更加广泛的系统的基础。

USM已经在YouTube上使用,用于生成封闭式字幕和自动语音识别(ASR)。该模型还支持自动检测和翻译语言,包括英语、普通话、阿姆哈拉语、宿务语、阿萨姆语等等。

据网界科技了解,该技术的一个可能应用是在增强现实眼镜内提供实时翻译服务。这将极大地便利全球范围内的跨语言交流。然而,这项技术目前仍处于早期阶段,还存在一些出错的风险。在去年的I/O活动中,谷歌对阿拉伯语的错误表述就是一个例子。

谷歌在语言模型和机器学习领域的努力为我们提供了更多跨越语言和文化障碍的可能性。随着技术的不断进步,我们有理由相信,在未来,人工智能语音模型将在全球范围内推动跨语言交流,实现更加紧密的文化交流和信息共享。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13