Sora表现平平，可灵和混元轻松获胜

人工智能领域新动态

期待与争议并存，Sora的登场引发热议。

丨行业观察团队

丨全文约2500字，阅读时间约5分钟

备受瞩目的Sora终于揭开神秘面纱。

在OpenAI CEO山姆·奥特曼的连续12天预热下，全球的目光都聚焦在了这场备受期待的发布上。

丨服务器压力巨大，新用户注册暂停

从直播首日开始，OpenAI便占据了科技媒体的头条，直至Sora的亮相，热度达到了顶峰。全球用户的热情让OpenAI的服务器几乎崩溃，目前Sora的新用户注册功能仍未恢复。

丨社交平台上的吐槽声不断

然而，与2月份Sora demo发布时的全球轰动不同，Sora的正式推出却引来了广泛的吐槽。

深入分析这些声音，我们发现吐槽内容从对Sora能力的质疑，到对OpenAI营销策略的批评，甚至有人尖锐地指出OpenAI的优势正在消失。

是OpenAI的宣传过于夸张，还是用户的期望过高导致失望？

Sora表现平平，中国模型意外胜出

Sora的正式上线究竟有多火爆？

许多用户表示，即使愿意支付高额费用，也无法体验Sora。

2月份Sora demo的发布引起了巨大反响，之后众多AI企业在视频生成领域发力，纷纷宣称“对标Sora”。

经过近10个月的期待，Sora的诞生确实有其亮点，让我们先看看OpenAI官方强调的特点：

Sora性能提升，支持文本到视频、图像到视频、视频到视频的转换，最高支持1080p分辨率，最长视频时长可达20秒；

Storyboard功能：能够将一句话的提示扩展成有时间线的剧情，并支持二次编辑；

其他视频生成功能，如Blend功能融合两个视频、Remix功能替换视频中的元素、Re-Cut功能提取关键帧并延伸视频时长、Loop功能生成循环视频内容以及Style presets风格预设等。

尽管OpenAI提前告知用户“Sora并不完美，会犯错”，但用户似乎并不买账。体验后，许多用户对实际效果与宣传之间的差距表示不满。

丨@Purz.xyz在社交平台上列出Sora的不足

@Purz.xyz在社交平台和Youtube上详细列出了Sora的不足，主要观点是：效果不佳，价格昂贵。丨Youtube大V Marques Brownlee发布的测试视频：飞翔的犀牛

另一位大V MKBHD则提供了更全面的评测，他认为SORA在视频清晰度和地标场景生成方面做得很好，但在处理物理规律方面仍有不足，例如物体运动违反常理或突然消失又出现。丨Sora生成的体操场景仍是“灾难”

对物理规律的不理解在体操场景中尤为明显，这被认为是AI视频的图灵测试。

丨@Erik在社交平台上对Sora的评价

Sora的图像到视频表现也未能令人满意，另一位大V@Erik吐槽：经常出现幻觉和莫名其妙的错误，迫使用户不得不反复生成。模型生成的动作往往过快，且显得怪异且不连贯。

而且，他还对当前主流的视频生成应用进行了排名：

大多数场景首选Kling 1.5（国产：快手可灵）；

动态镜头选择Minimax（MINIMAX海螺AI）；

视频到视频和镜头控制使用Runway；

关键帧制作选择Luma；

Sora？可能只适合尝试一些实验性的、不可预测的动作。

是的，你没看错，可灵和海螺成为了这位海外大V更推荐的选项。

而且，不止是他，另一位网友@Bilawal Sidhu还发布了200美元/月的Sora与免费混元生成的对比视频，直言：Sora被免费的混元击败了。

丨@Bilawal Sidhu表示“Sora被混元击败了”

实际上，自从Sora年初的demo发布以来的10个月里，视频生成领域竞争已经非常激烈。来自中国的快手可灵、MINIMAX海螺AI以及腾讯混元等，已经在海外市场获得了一定的关注。

丨@Bilawal 美国科技媒体Ars Technica的报道

美国科技媒体Ars Technica的资深AI记者Benj Edwards也写道：在过去的几个月里，竞争对手的视频生成模型“已经夺走了Sora发布的光彩”。

无论是因为Sora的迟到，还是因为网友的高期望，预期的惊艳和惊喜并未出现，一片吐槽声中，中国的可灵、海螺AI以及混元反而意外胜出。

AI视频生成领域的竞争

但是，仅凭Sora发布两天来的吐槽就否定其价值，未免过于草率。

使用过视频生成应用的用户都知道，AI视频的连续性很差，单次生成的通常只是一个画面或一个意群，能够承载的信息量有限，距离完整的影片还有很长的路要走。

在Sora发布直播中，OpenAI也明确表示：“如果你认为只需点击一个按钮就能生成一部故事片，那么你可能对Sora抱有错误的期望”。

丨OpenAI发布Sora前的预告，画面精美，想象丰富

事实上，国内外Sora的竞品如Runway、Luma、可灵、海螺、即梦、Vidu等，都有各自的特色，很难说哪个产品具有绝对的领先优势。

有深度创作用户在评价这些工具时表示：从电影制作的角度来看，可灵的现实效果最实用，海螺在某些情况下表现不错，但水平不一致；Runway更适合制作大场面，即梦适合制作人物，Vidu生成的二次元视频比其他工具要好。

因此，目前深度创作用户通常不会只使用一种工具，而是根据不同的场景选择不同的工具组合。

正因如此，我们认为，AI视频生成领域的竞争不仅仅是生成画面的单一维度，而是在于：

谁能够更好地赋能普通创作者，在可控性与效果、易得性与门槛、便捷性与工作流上，更好地满足和服务创作者，谁就能赢得这场竞争。

而目前，竞争还处于早期阶段，技术仍在持续迭代发展中。

结语

丨OpenAI发布会直播

OpenAI的系列发布仍在继续，从首日的o1模型和ChatGPT Pro版本，到强化微调技术，再到Sora和Canvas，热度一路飙升，争议与讨论并存。

距离ChatGPT发布已经两年了。

两年间，ChatGPT逐渐被其他产品追赶甚至超越，光环逐渐褪去；ChatGPT Search没有引起太大反响；Sora引发了系列直播以来声量最大的吐槽；“宫斗”后一年来，包括首席科学家伊利亚在内的大批核心员工离职……OpenAI始终处于媒体的聚光灯和舆论的风暴眼中。

同时，传统巨头和AI新贵也在争相发力AI，技术不断迭代，产品层出不穷，新的观点、新的路线、新的尝试也一直在路上。

日新月异、唯变不变，新和变是这两年来的关键词。

既然如此，且不说OpenAI是否优势不再，即使真的不再，那又何妨？谁能一直独领风骚？最重要的是，对更广大的用户和市场而言，一个竞争更充分、更多元化的AI发展生态，不是比一枝独秀、唯我独美的生态更健康、更安全吗？

END