网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里巴巴图生视频专利公布:智能化视频生成迈向新台阶

2025-02-07来源:ITBEAR编辑:瑞雪

近期,阿里巴巴(中国)有限公司在视频生成技术领域的一项新进展引起了广泛关注。据天眼查知识产权信息透露,该公司已成功获得“一种图生视频方法和装置”的专利授权,标志着其在智能化视频生成领域取得了重要突破。

该专利的核心技术在于实现智能化、端到端的图像到视频的转换过程。具体而言,这一方法首先会将包含目标对象的源图像输入至一个先进的视频生成模型中,以此为基础生成初步的素材视频。随后,系统会分析素材视频,确定帧间变换矩阵序列,为后续的图像处理提供关键数据支持。

在此基础上,专利进一步利用源图像生成目标对象对应的对象掩码图像。通过应用帧间变换矩阵序列,系统能够生成一系列掩码图像和目标对象图像。这些图像序列为后续的视频生成提供了丰富的素材。

接下来,系统会整合源图像、掩码图像序列和目标对象图像序列,形成目标输入数据。这些数据随后被送入另一个支持局部重绘的视频生成模型中,经过精细处理,最终生成高质量的目标视频。这一过程巧妙地结合了两次模型生成,不仅显著提升了视频生成的智能化程度,还确保了目标对象在视频中的运动轨迹多样且自然,避免了不必要的扩散现象。

尤为该专利无需预设运动参数即可实现上述复杂的视频生成过程。这一创新特性赋予了视频生成更大的灵活性和多样性,使其能够适应更多样化的应用场景需求。无论是广告制作、动画制作还是虚拟现实等领域,该技术都有望发挥重要作用。

安谋科技发布“周易”X3 NPU IP,AIGC大模型能力跃升开启端侧AI新篇
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-15

百度李彦宏2025世界大会发声:AI内化驱动,开启生产力革命新篇章
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14