678CHAT AI资讯 Sora表现平平,可灵和混元轻松获胜

Sora表现平平,可灵和混元轻松获胜

人工智能领域新动态

Sora表现平平,可灵和混元轻松获胜插图

期待与争议并存,Sora的登场引发热议。

丨行业观察团队

丨全文约2500字,阅读时间约5分钟

备受瞩目的Sora终于揭开神秘面纱。

在OpenAI CEO山姆·奥特曼的连续12天预热下,全球的目光都聚焦在了这场备受期待的发布上。

丨服务器压力巨大,新用户注册暂停

从直播首日开始,OpenAI便占据了科技媒体的头条,直至Sora的亮相,热度达到了顶峰。全球用户的热情让OpenAI的服务器几乎崩溃,目前Sora的新用户注册功能仍未恢复。

丨社交平台上的吐槽声不断

然而,与2月份Sora demo发布时的全球轰动不同,Sora的正式推出却引来了广泛的吐槽。

深入分析这些声音,我们发现吐槽内容从对Sora能力的质疑,到对OpenAI营销策略的批评,甚至有人尖锐地指出OpenAI的优势正在消失。

是OpenAI的宣传过于夸张,还是用户的期望过高导致失望?

Sora表现平平,中国模型意外胜出

Sora的正式上线究竟有多火爆?

许多用户表示,即使愿意支付高额费用,也无法体验Sora。

2月份Sora demo的发布引起了巨大反响,之后众多AI企业在视频生成领域发力,纷纷宣称“对标Sora”。

经过近10个月的期待,Sora的诞生确实有其亮点,让我们先看看OpenAI官方强调的特点:

Sora性能提升,支持文本到视频、图像到视频、视频到视频的转换,最高支持1080p分辨率,最长视频时长可达20秒;

Storyboard功能:能够将一句话的提示扩展成有时间线的剧情,并支持二次编辑;

其他视频生成功能,如Blend功能融合两个视频、Remix功能替换视频中的元素、Re-Cut功能提取关键帧并延伸视频时长、Loop功能生成循环视频内容以及Style presets风格预设等。

尽管OpenAI提前告知用户“Sora并不完美,会犯错”,但用户似乎并不买账。体验后,许多用户对实际效果与宣传之间的差距表示不满。

丨@Purz.xyz在社交平台上列出Sora的不足

@Purz.xyz在社交平台和Youtube上详细列出了Sora的不足,主要观点是:效果不佳,价格昂贵。丨Youtube大V Marques Brownlee发布的测试视频:飞翔的犀牛

另一位大V MKBHD则提供了更全面的评测,他认为SORA在视频清晰度和地标场景生成方面做得很好,但在处理物理规律方面仍有不足,例如物体运动违反常理或突然消失又出现。丨Sora生成的体操场景仍是“灾难”

对物理规律的不理解在体操场景中尤为明显,这被认为是AI视频的图灵测试。

丨@Erik在社交平台上对Sora的评价

Sora的图像到视频表现也未能令人满意,另一位大V@Erik吐槽:经常出现幻觉和莫名其妙的错误,迫使用户不得不反复生成。模型生成的动作往往过快,且显得怪异且不连贯。

而且,他还对当前主流的视频生成应用进行了排名:

大多数场景首选Kling 1.5(国产:快手可灵);

动态镜头选择Minimax(MINIMAX海螺AI);

Sora表现平平,可灵和混元轻松获胜插图1

视频到视频和镜头控制使用Runway;

关键帧制作选择Luma;

Sora?可能只适合尝试一些实验性的、不可预测的动作。

是的,你没看错,可灵和海螺成为了这位海外大V更推荐的选项。

而且,不止是他,另一位网友@Bilawal Sidhu还发布了200美元/月的Sora与免费混元生成的对比视频,直言:Sora被免费的混元击败了。

丨@Bilawal Sidhu表示“Sora被混元击败了”

实际上,自从Sora年初的demo发布以来的10个月里,视频生成领域竞争已经非常激烈。来自中国的快手可灵、MINIMAX海螺AI以及腾讯混元等,已经在海外市场获得了一定的关注。

丨@Bilawal 美国科技媒体Ars Technica的报道

美国科技媒体Ars Technica的资深AI记者Benj Edwards也写道:在过去的几个月里,竞争对手的视频生成模型“已经夺走了Sora发布的光彩”。

无论是因为Sora的迟到,还是因为网友的高期望,预期的惊艳和惊喜并未出现,一片吐槽声中,中国的可灵、海螺AI以及混元反而意外胜出。

AI视频生成领域的竞争

但是,仅凭Sora发布两天来的吐槽就否定其价值,未免过于草率。

使用过视频生成应用的用户都知道,AI视频的连续性很差,单次生成的通常只是一个画面或一个意群,能够承载的信息量有限,距离完整的影片还有很长的路要走。

在Sora发布直播中,OpenAI也明确表示:“如果你认为只需点击一个按钮就能生成一部故事片,那么你可能对Sora抱有错误的期望”。

丨OpenAI发布Sora前的预告,画面精美,想象丰富

事实上,国内外Sora的竞品如Runway、Luma、可灵、海螺、即梦、Vidu等,都有各自的特色,很难说哪个产品具有绝对的领先优势。

有深度创作用户在评价这些工具时表示:从电影制作的角度来看,可灵的现实效果最实用,海螺在某些情况下表现不错,但水平不一致;Runway更适合制作大场面,即梦适合制作人物,Vidu生成的二次元视频比其他工具要好。

因此,目前深度创作用户通常不会只使用一种工具,而是根据不同的场景选择不同的工具组合。

正因如此,我们认为,AI视频生成领域的竞争不仅仅是生成画面的单一维度,而是在于:

谁能够更好地赋能普通创作者,在可控性与效果、易得性与门槛、便捷性与工作流上,更好地满足和服务创作者,谁就能赢得这场竞争。

而目前,竞争还处于早期阶段,技术仍在持续迭代发展中。

结 语

丨OpenAI发布会直播

OpenAI的系列发布仍在继续,从首日的o1模型和ChatGPT Pro版本,到强化微调技术,再到Sora和Canvas,热度一路飙升,争议与讨论并存。

距离ChatGPT发布已经两年了。

两年间,ChatGPT逐渐被其他产品追赶甚至超越,光环逐渐褪去;ChatGPT Search没有引起太大反响;Sora引发了系列直播以来声量最大的吐槽;“宫斗”后一年来,包括首席科学家伊利亚在内的大批核心员工离职……OpenAI始终处于媒体的聚光灯和舆论的风暴眼中。

同时,传统巨头和AI新贵也在争相发力AI,技术不断迭代,产品层出不穷,新的观点、新的路线、新的尝试也一直在路上。

日新月异、唯变不变,新和变是这两年来的关键词。

既然如此,且不说OpenAI是否优势不再,即使真的不再,那又何妨?谁能一直独领风骚?最重要的是,对更广大的用户和市场而言,一个竞争更充分、更多元化的AI发展生态,不是比一枝独秀、唯我独美的生态更健康、更安全吗?

Sora表现平平,可灵和混元轻松获胜插图2

END

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/5882.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注