阶跃星辰视频模型开源啦！能控制运动幅度和镜头运动

在多模态技术飞速发展的当下，阶跃星辰团队于 3 月 20 日再次为影视创作领域带来重磅开源成果——Step-Video-TI2V 图生视频模型。这款基于 30B 参数 Step-Video-T2V 训练而成的模型，能够生成 102 帧、5 秒时长、540P 分辨率的视频，其两大核心亮点是运动幅度可控和镜头运动可控，同时还具备一定的特效生成能力。

与现有的开源图生视频模型相比，Step-Video-TI2V 在参数规模上实现了突破，为该领域的研究提供了更高的上限。更重要的是，其运动幅度可控能力能够平衡图生视频生成结果的动态性和稳定性，创作者可以根据创作需求自由选择动态或稳定的画面效果。

目前，Step-Video-TI2V 已成功适配华为昇腾计算平台，并在魔乐社区（Modelers）上线，为创作者提供了更强大的技术支持和创作平台。

Step-Video-TI2V 的核心特点如下：

1、运动幅度可控：动态与稳定自由切换

Step-Video-TI2V 具备独特的运动幅度控制功能，能够精准地平衡图生视频内容的运动性和稳定性。无论创作者需要静态稳定的画面，还是高动态动作场景，该模型都能轻松满足，为创作提供了极大的灵活性。

2、多种运镜控制

除了对镜头内主体运动的精准控制外，Step-Video-TI2V 还支持对多种运镜方式的理解和生成。从基本的推拉摇移、升降镜头，到复杂的电影级运镜效果，该模型都能轻松驾驭，为创作者带来大片级的运镜体验。

3、动漫效果尤佳

在动漫类任务上，Step-Video-TI2V 表现尤为出色，能够生成高质量的动漫风格视频，非常适合动画创作、短视频制作等应用场景，为动漫创作者提供了强大的工具。

4、支持多尺寸生成

Step-Video-TI2V 支持多种尺寸的图生视频生成，无论是横屏的宽阔视野、竖屏的沉浸体验，还是方屏的经典复古风格，都能轻松实现。用户可以根据不同的创作需求和平台特性，自由选择图片尺寸，无需担心画面变形或比例失调的问题。

如今，Step-Video-TI2V 模型已经正式开源，阶跃 AI 网页版和 App 端均已上线，为创作者提供了便捷的使用渠道。

值得一提的是，Step-Video-TI2V 已初步具备一些特效生成能力。未来，阶跃星辰团队还将通过 LoRA 等技术，持续挖掘和解锁模型的特效潜力，为影视创作带来更多惊喜。

感兴趣的创作者可以访问以下链接获取更多相关信息：

GitHub：

https://github.com/stepfun-ai/Step-Video-TI2V

Github-ComfyUI：

https://github.com/stepfun-ai/ComfyUI-StepVideo

技术报告：

https://arxiv.org/abs/2503.11251

1、运动幅度可控：动态与稳定自由切换

2、多种运镜控制

3、动漫效果尤佳

4、支持多尺寸生成

相关文章

Second Me来袭：用开源AI整出专属数字分身

谷歌给Gmail搜索加了AI升级，找邮件更溜了

马斯克的xAI推图像生成接口啦，每张图收7分钱

高中生用《我的世界》盖了个AI模型打分网站，大家一起评

老板电器搞了个超酷的食神AI烹饪模型，智能厨房新体验来袭

OpenAI 推出 GPT-4o Transcribe 等新语音模型，语音 AI 有大突破

发表回复 取消回复

发表回复取消回复