网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

字节跳动OmniHuman模型:一张图一段音,AI视频轻松生

2025-02-07来源:ITBEAR编辑:瑞雪

近日,第一财经传来消息,字节跳动旗下的一站式AI创作平台即梦AI即将推出一款名为OmniHuman的多模态视频生成模型。这款模型能够通过一张图片与一段音频,自动生成AI视频,展现出了强大的技术实力。据悉,OmniHuman为字节跳动自研的闭源模型,标志着字节跳动在AI视频生成领域迈出了重要一步。

据即梦AI相关负责人介绍,OmniHuman模型将在未来进行小范围内的测试。为了确保内容的安全性和合规性,官方将设置严格的安全审核机制,对所有输出的视频进行仔细筛查。为了明确区分AI生成内容与真实内容,所有通过OmniHuman生成的视频都将被标注上独特的水印。

值得注意的是,字节跳动的研究人员近日已经向外界展示了OmniHuman模型的部分功能。通过一张图片和一段音频,该模型能够生成半身乃至全身的视频动画。这一功能与此前只能生成面部或上半身动画的深度伪造技术相比,无疑是一个巨大的进步。OmniHuman-1不仅能够生成逼真的全身动画,还能够将手势和面部表情与语音或音乐精准同步,为用户带来更加真实、生动的视觉体验。

据了解,OmniHuman模型的推出,将进一步丰富即梦AI平台的功能,为用户提供更多样化的创作选择。无论是想要制作个人短片、广告宣传还是其他类型的视频内容,用户都可以借助这款模型,以更加高效、便捷的方式实现自己的创意。

随着AI技术的不断发展,越来越多的创新应用正在不断涌现。字节跳动此次推出的OmniHuman模型,无疑为AI视频生成领域注入了新的活力。未来,我们期待看到更多像OmniHuman这样的创新应用,为我们的生活和工作带来更多便利和乐趣。

阿里通义App焕新升级更名千问 5.0.0版本携三大核心能力强势登场
今日,阿里旗下通义App今日发布更新,名称正式变更为千问App,版本号为5.0.0。 在版本 5.0.0中,千问强调其核心能力包括:“对话问答”“智能写作”“全能相机”三大模块。 据知情人士透露,阿里巴巴计…

2025-11-15

谷歌前工程师再创业!AI数据分析新锐WisdomAI获英伟达等3.55亿融资
WisdomAI面向企业客户推出了AI驱动的对话式商业智能(BI)平台,提供AI数据分析业务,用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称:“过去的BI只提供被动的、静态的仪表板,而Ag…

2025-11-15

百度世界大会发布AI新成果:文心5.0、昆仑芯升级,萝卜快跑领跑全球
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度世界大会亮点频出:文心5.0等成果发布,AI重构业务引领生产力革新
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

乌镇峰会:前沿科技碰撞,共绘网络空间命运共同体数智新蓝图
“非洲互联网之父”、加纳科网董事长尼·奎诺表示,像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间;世界知识产权组织总干事邓鸿森表示,乌镇峰会为我们提供全球对话与合作的契机,这种对话与合作不仅是…

2025-11-13