网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

字节跳动推出Seedance 1.5 pro模型:多语种方言支持 音视频同步生成再升级

2025-12-17来源:天脉网编辑:瑞雪

字节跳动近日正式推出全新音视频生成模型Seedance 1.5 pro,该模型突破性地实现了从文本或图像直接生成带有同步音频的动态视频,标志着音视频联合生成技术迈入新阶段。通过深度优化音画同步机制,模型能够精准匹配口型动作、语音语调与表演节奏,在多语言场景下展现出显著优势。

技术团队介绍,Seedance 1.5 pro支持中、英、日等主流语言,并特别强化了方言语音模拟能力,可精准还原四川话、粤语等地域特色发音。在视频生成维度,模型创新性地引入自主运镜调度系统,能够自动生成长镜头跟随、希区柯克式变焦等专业级拍摄效果,显著提升画面叙事张力。某影视制作公司测试显示,使用该模型生成的广告片在动态构图方面达到行业中等水平。

该模型采用基于MMDiT架构的联合生成框架,通过多阶段数据链路优化与强化学习训练,实现了音视频内容的协同创作。在影视创作、广告制作、互动短剧等场景的实测中,生成内容在指令响应准确度、音频保真度等指标上较前代提升37%,但在复杂物理运动模拟、多角色交互等高阶功能上仍需持续优化。技术白皮书显示,模型目前可处理包含5个以上角色的场景,但对话连贯性存在12%的误差率。

据开发团队透露,Seedance 1.5 pro已向特定行业用户开放内测,首批合作方涵盖影视制作公司、广告代理商及游戏开发商。某知名短视频平台测试数据显示,使用该模型生成的30秒剧情短视频,制作周期从传统方式的72小时缩短至8小时,人力成本降低65%。技术文档特别指出,模型在生成历史题材内容时,可通过参数调整实现不同朝代的服饰、建筑风格自动适配。

鸿蒙电脑企业版Beta启动,十余家伙伴携手发布多款PC版鸿蒙办公应用
作为政企办公应用领域的杰出代表,像素绽放Pixelbloom(北京饼干科技有限公司)、北京元空智能科技有限公司、成都景中教育软件有限公司、成都艾斯莱德网络科技有限公司、武汉噢易云计算股份有限公司、湖南三岳数…

2025-12-17

春节前手机市场迎新品潮!多品牌中端机大电池高性能齐上阵
据爆料,Redmi Turbo 5系列有望在春节前发布,其标准版或全球首发天玑8500处理器,而Pro版则可能搭载更强的天玑9系旗舰芯片;Pro版据称将配备约9000mAh电池和100W闪充,并可能采用1.…

2025-12-17

鹏城实验室发布“星语2.0”大模型 助力跨语言交流与国际化发展
以“AI & Governance|人工智能&创新治理”为主题的2025大湾区科学论坛人工智能分论坛暨第六届中国(广东)人工智能论坛日前在广州南沙举行,鹏城实验室在论坛上对外发布“鹏城·脑海-星语2.0”多…

2025-12-16

谷歌与电力巨头携手:AI驱动核电重启,共绘能源科技融合新蓝图
科技巨头谷歌与全球市值最高的电力公司新纪元能源(NextEra Energy)正式宣布达成深度战略合作,计划共同开发与大型电厂直接配套的“吉瓦级”AI数据中心园区,一场围绕AI算力展开的能源变革大幕就此拉开。…

2025-12-16

华为nova 15 Ultra外观公布;我国首批L3级自动驾驶车型开启上路试点
12 月 16 日消息,科技媒体 Wccftech 昨日(12 月 15 日)发布博文,报道称苹果正在深化其垂直整合战略,不仅在消费电子端发力,更将触角伸向了核心算力基础设施,加速研发代号为“Baltra”…

2025-12-16

苹果年末再发力:iOS 26.3与iPadOS 26.3首个测试版已向开发者推送
【CNMO科技消息】近日,苹果公司向注册开发者正式推送了iOS 26.3和iPadOS26.3的首个测试版本,标志着这两个系统更新进入内部测试阶段。此次更新距离iOS 26.2与iPadOS 26.2正式版…

2025-12-16