网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

讯飞智作推超拟人数字人,大模型技术表情动作逼近真人!

2024-10-25来源:ITBEAR编辑:瑞雪

在合肥奥体中心,第七届世界声博会暨科大讯飞全球1024开发者节盛大开幕,科大讯飞借此机会展示了其最新的多模态视觉交互技术和超拟人数字人。这一创新不仅震撼了行业,也预示着数字人技术的新篇章。

科大讯飞研究院院长刘聪在活动现场演示了如何通过一张照片快速生成超拟人数字人,这一技术极大简化了数字人的定制流程,降低了应用门槛。用户只需上传个人照片,便能获得一个高度拟真的数字人形象。

除了形象定制,科大讯飞还推出了情感贯穿的多模态交互技术,使数字人能够根据语境实时调整表情,实现更自然的情感表达。这一技术让数字人的面部表情更加生动,情感传递更加准确。

在肢体动作驱动方面,科大讯飞也实现了技术创新。超拟人数字人的肢体动作能够根据语音的节奏、语调和内容实时生成,摆脱了预设模板动作的限制,提升了数字人在动态场景中的表现力。

科大讯飞还采用了中间表征压缩技术,提升了数字人在多场景下的实时交互能力。这一技术有效压缩了视频维度,减少了计算量,保障了数字人与用户的实时互动。

科大讯飞数字人技术已广泛应用于金融、政务、文旅、商业、展会等多个领域。讯飞智作作为智能内容创作基地,结合星火认知大模型,为用户提供一站式的虚拟人解决方案,降低了服务成本,提升了用户体验。

目前,首发超拟人虚拟人的内测通道已在讯飞智作小程序上开放。依托星火大模型的基座能力,用户可以实现任意一张照片的快速驱动生成,定制属于自己的超拟人数字人。

阿里通义App焕新升级更名千问 5.0.0版本携三大核心能力强势登场
今日,阿里旗下通义App今日发布更新,名称正式变更为千问App,版本号为5.0.0。 在版本 5.0.0中,千问强调其核心能力包括:“对话问答”“智能写作”“全能相机”三大模块。 据知情人士透露,阿里巴巴计…

2025-11-15

谷歌前工程师再创业!AI数据分析新锐WisdomAI获英伟达等3.55亿融资
WisdomAI面向企业客户推出了AI驱动的对话式商业智能(BI)平台,提供AI数据分析业务,用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称:“过去的BI只提供被动的、静态的仪表板,而Ag…

2025-11-15

百度世界大会发布AI新成果:文心5.0、昆仑芯升级,萝卜快跑领跑全球
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度世界大会亮点频出:文心5.0等成果发布,AI重构业务引领生产力革新
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

乌镇峰会:前沿科技碰撞,共绘网络空间命运共同体数智新蓝图
“非洲互联网之父”、加纳科网董事长尼·奎诺表示,像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间;世界知识产权组织总干事邓鸿森表示,乌镇峰会为我们提供全球对话与合作的契机,这种对话与合作不仅是…

2025-11-13