在多模态技术飞速发展的当下,阶跃星辰团队于 3 月 20 日再次为影视创作领域带来重磅开源成果——Step-Video-TI2V 图生视频模型。这款基于 30B 参数 Step-Video-T2V 训练而成的模型,能够生成 102 帧、5 秒时长、540P 分辨率的视频,其两大核心亮点是运动幅度可控和镜头运动可控,同时还具备一定的特效生成能力。
与现有的开源图生视频模型相比,Step-Video-TI2V 在参数规模上实现了突破,为该领域的研究提供了更高的上限。更重要的是,其运动幅度可控能力能够平衡图生视频生成结果的动态性和稳定性,创作者可以根据创作需求自由选择动态或稳定的画面效果。
目前,Step-Video-TI2V 已成功适配华为昇腾计算平台,并在魔乐社区(Modelers)上线,为创作者提供了更强大的技术支持和创作平台。
Step-Video-TI2V 的核心特点如下:
1、运动幅度可控:动态与稳定自由切换
Step-Video-TI2V 具备独特的运动幅度控制功能,能够精准地平衡图生视频内容的运动性和稳定性。无论创作者需要静态稳定的画面,还是高动态动作场景,该模型都能轻松满足,为创作提供了极大的灵活性。
2、多种运镜控制
除了对镜头内主体运动的精准控制外,Step-Video-TI2V 还支持对多种运镜方式的理解和生成。从基本的推拉摇移、升降镜头,到复杂的电影级运镜效果,该模型都能轻松驾驭,为创作者带来大片级的运镜体验。
3、动漫效果尤佳
在动漫类任务上,Step-Video-TI2V 表现尤为出色,能够生成高质量的动漫风格视频,非常适合动画创作、短视频制作等应用场景,为动漫创作者提供了强大的工具。
4、支持多尺寸生成
Step-Video-TI2V 支持多种尺寸的图生视频生成,无论是横屏的宽阔视野、竖屏的沉浸体验,还是方屏的经典复古风格,都能轻松实现。用户可以根据不同的创作需求和平台特性,自由选择图片尺寸,无需担心画面变形或比例失调的问题。
如今,Step-Video-TI2V 模型已经正式开源,阶跃 AI 网页版和 App 端均已上线,为创作者提供了便捷的使用渠道。
值得一提的是,Step-Video-TI2V 已初步具备一些特效生成能力。未来,阶跃星辰团队还将通过 LoRA 等技术,持续挖掘和解锁模型的特效潜力,为影视创作带来更多惊喜。
感兴趣的创作者可以访问以下链接获取更多相关信息:
GitHub:
https://github.com/stepfun-ai/Step-Video-TI2V
Github-ComfyUI:
https://github.com/stepfun-ai/ComfyUI-StepVideo
技术报告:
https://arxiv.org/abs/2503.11251