网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

生数科技Vidu Q1大模型发布:视频动作行为,皆可精准调控

2025-03-29来源:ITBEAR编辑:瑞雪

近日,清华大学人工智能研究院的一项重大创新引发了业界的广泛关注。该研究院副院长、同时也是生数科技创始人及首席科学家的朱军,正式推出了名为Vidu Q1的高可控视频大模型,这一成果被标榜为行业内首个具备高度可控性的AI视频大模型。

据官方介绍,Vidu Q1在多个关键技术领域实现了显著突破,尤其是在多主体细节可控性、音效同步控制以及画质增强方面。以多主体细节可控为例,该模型不仅能够基于语义指令进行操作,还能融入参考图的视觉信息,进一步实现对视频中多个主体位置、大小、运动轨迹等属性的精确控制。无论是角色的出场顺序、退场方式,还是坐立姿态、行动路线,Vidu Q1都能进行细致入微的调整,以满足用户的多样化需求。

在音效同步控制方面,Vidu Q1同样表现出色。它能够根据视频环境的变化和画面的切换,自动生成相应的音效,并实现对音效长短区间和出现时间点的精准控制。例如,在视频的前两秒内,可以精确设置风声作为背景音效,而在接下来的三到五秒内,则切换为雨声,从而营造出更加真实、生动的视听体验。

这一创新成果的问世,标志着AI视频生成技术迈上了一个新的台阶。Vidu Q1的高可控性不仅为用户提供了更加灵活多样的视频创作方式,也为视频制作、动画制作、广告创意等行业带来了全新的可能性。可以预见,随着该技术的不断成熟和推广,它将在未来发挥更加重要的作用,推动相关行业的快速发展。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13