网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里巴巴新专利:智能化端到端图生视频技术曝光

2025-02-08来源:新浪财经编辑:瑞雪

近日,阿里巴巴(中国)有限公司在视频生成技术领域取得了新突破,一项名为“一种图生视频方法和装置”的专利正式公布。这一创新成果由天眼查知识产权信息渠道披露,标志着阿里巴巴在智能化视频生成方面迈出了重要一步。

据专利摘要介绍,该发明通过一系列复杂的处理流程,成功实现了从静态图像到动态视频的智能化转换。具体而言,该方法首先将包含目标对象的源图像输入到第一视频生成模型中,生成基础的素材视频。随后,系统会根据素材视频确定帧间变换矩阵序列,这一步骤对于捕捉和模拟对象的运动轨迹至关重要。

在此基础上,发明者进一步从源图像中提取出目标对象对应的对象掩码图像。通过将帧间变换矩阵序列应用于对象掩码图像,可以生成一系列掩码图像,这些图像共同组成了掩码图像序列。同样地,将帧间变换矩阵序列应用于源图像,可以生成一系列目标对象图像,形成目标对象图像序列。

接下来,系统会根据源图像、掩码图像序列和目标对象图像序列,确定目标输入数据。这些数据被输入到支持局部重绘的第二视频生成模型中,经过一系列复杂的运算和处理,最终生成对应的目标视频。这一过程不仅实现了智能化端到端的图生视频,还能够在不引入预设运动参数的情况下,保持目标对象不扩散,同时实现运动轨迹的多样性。

这一创新技术的出现,无疑将为视频制作领域带来革命性的变化。以往,从静态图像生成动态视频往往需要大量的手工操作和预设参数,不仅耗时耗力,而且难以保证视频的质量和多样性。而阿里巴巴的这项专利,通过智能化的处理方式,大大提高了视频生成的效率和灵活性。

该专利还展示了阿里巴巴在人工智能和机器学习领域的深厚积累。通过两次模型生成视频的方式,系统能够更准确地捕捉和模拟对象的运动轨迹,生成更加自然和逼真的视频效果。这一技术的成功应用,不仅将推动视频制作行业的发展,还将为其他领域提供有益的借鉴和启示。

随着人工智能技术的不断发展,越来越多的创新应用正在不断涌现。阿里巴巴的这项专利,无疑是其中的佼佼者之一。它不仅展示了人工智能技术的巨大潜力,也为视频制作领域的未来发展指明了方向。我们有理由相信,在不久的将来,这项技术将会得到更广泛的应用和推广,为人们的生活带来更多便利和乐趣。

百度“文心杯”第三届落幕!8支团队获千万投资,李彦宏盼AI应用星火燎原
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-14

MIT四名00后辍学生创业Cursor:两年冲刺300亿估值 获谷歌英伟达重投
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

百度AI成果爆发:从智能到效果涌现,重构产业开启全球化新篇
百度搜索富媒体结果覆盖率已达70%,萝卜快跑全球出行服务超1700万次,文心大模型5.0亮相——百度AI成果集中爆发,标志着AI从“智能涌现”迈向“效果涌现”的临界点已至。 百度AI业务的集体出海,代表了中国…

2025-11-14

百度发布新一代昆仑芯与天池超节点 未来持续加码AI云建设
在近日举办的百度世界大会上,百度公司重磅推出新一代昆仑芯及超节点产品“天池”,并宣布未来五年将每年发布创新产品,致力于构建顶尖AI云服务生态,赋能企业深度融合AI技术。

2025-11-14

李彦宏2025百度世界大会发声:搜索结果AI主导,AI搜索能力开放合作
11 月 13 日消息,在今日的 2025 百度世界大会上,百度创始人李彦宏表示,百度搜索绝大部分的搜索结果由 AI生成,而首条结果的富媒体覆盖率已达 70%。 IT之家从大会获悉,百度还通过 AI API…

2025-11-13

李彦宏2025百度世界大会演讲:AI内化驱动产业变革 开启智能生产力新纪元
“当下非常重要的问题是,企业如何内化AI能力”——李彦宏介绍,这有三个代表性的应用方向: 李彦宏指出,百度是全球所有搜索引擎中AI化改造最激进的,用AI重构搜索结果页,而非简单插入AI摘要,“把搜索从一个以…

2025-11-13