【科技快报网】阿里发布通义万相2.6系列模型,面向专业影视与图像创作,首次在国内实现角色扮演视频生成,集成音画同步、多镜头、声音驱动技术,可建模参考视频的时序情绪、姿态、多角度视觉及音色语速,实现画面到声音全维度一致性迁移,支持单人及多人表演;新版本画质、音效、指令遵循提升,单次生成时长达国内最高的15秒,并新增角色扮演与分镜控制,可一键完成合拍及多镜头切换。
【科技快报网】阿里发布通义万相2.6系列模型,面向专业影视与图像创作,首次在国内
莺歌科技堂
2025-12-16 16:24:36
0
阅读:0