人工智能领域新动态
期待与争议并存,Sora的登场引发热议。
丨行业观察团队
丨全文约2500字,阅读时间约5分钟
备受瞩目的Sora终于揭开神秘面纱。
在OpenAI CEO山姆·奥特曼的连续12天预热下,全球的目光都聚焦在了这场备受期待的发布上。
丨服务器压力巨大,新用户注册暂停
从直播首日开始,OpenAI便占据了科技媒体的头条,直至Sora的亮相,热度达到了顶峰。全球用户的热情让OpenAI的服务器几乎崩溃,目前Sora的新用户注册功能仍未恢复。
丨社交平台上的吐槽声不断
然而,与2月份Sora demo发布时的全球轰动不同,Sora的正式推出却引来了广泛的吐槽。
深入分析这些声音,我们发现吐槽内容从对Sora能力的质疑,到对OpenAI营销策略的批评,甚至有人尖锐地指出OpenAI的优势正在消失。
是OpenAI的宣传过于夸张,还是用户的期望过高导致失望?
Sora表现平平,中国模型意外胜出
Sora的正式上线究竟有多火爆?
许多用户表示,即使愿意支付高额费用,也无法体验Sora。
2月份Sora demo的发布引起了巨大反响,之后众多AI企业在视频生成领域发力,纷纷宣称“对标Sora”。
经过近10个月的期待,Sora的诞生确实有其亮点,让我们先看看OpenAI官方强调的特点:
Sora性能提升,支持文本到视频、图像到视频、视频到视频的转换,最高支持1080p分辨率,最长视频时长可达20秒;
Storyboard功能:能够将一句话的提示扩展成有时间线的剧情,并支持二次编辑;
其他视频生成功能,如Blend功能融合两个视频、Remix功能替换视频中的元素、Re-Cut功能提取关键帧并延伸视频时长、Loop功能生成循环视频内容以及Style presets风格预设等。
尽管OpenAI提前告知用户“Sora并不完美,会犯错”,但用户似乎并不买账。体验后,许多用户对实际效果与宣传之间的差距表示不满。
丨@Purz.xyz在社交平台上列出Sora的不足
@Purz.xyz在社交平台和Youtube上详细列出了Sora的不足,主要观点是:效果不佳,价格昂贵。丨Youtube大V Marques Brownlee发布的测试视频:飞翔的犀牛
另一位大V MKBHD则提供了更全面的评测,他认为SORA在视频清晰度和地标场景生成方面做得很好,但在处理物理规律方面仍有不足,例如物体运动违反常理或突然消失又出现。丨Sora生成的体操场景仍是“灾难”
对物理规律的不理解在体操场景中尤为明显,这被认为是AI视频的图灵测试。
丨@Erik在社交平台上对Sora的评价
Sora的图像到视频表现也未能令人满意,另一位大V@Erik吐槽:经常出现幻觉和莫名其妙的错误,迫使用户不得不反复生成。模型生成的动作往往过快,且显得怪异且不连贯。
而且,他还对当前主流的视频生成应用进行了排名:
大多数场景首选Kling 1.5(国产:快手可灵);
动态镜头选择Minimax(MINIMAX海螺AI);
视频到视频和镜头控制使用Runway;
关键帧制作选择Luma;
Sora?可能只适合尝试一些实验性的、不可预测的动作。
是的,你没看错,可灵和海螺成为了这位海外大V更推荐的选项。
而且,不止是他,另一位网友@Bilawal Sidhu还发布了200美元/月的Sora与免费混元生成的对比视频,直言:Sora被免费的混元击败了。
丨@Bilawal Sidhu表示“Sora被混元击败了”
实际上,自从Sora年初的demo发布以来的10个月里,视频生成领域竞争已经非常激烈。来自中国的快手可灵、MINIMAX海螺AI以及腾讯混元等,已经在海外市场获得了一定的关注。
丨@Bilawal 美国科技媒体Ars Technica的报道
美国科技媒体Ars Technica的资深AI记者Benj Edwards也写道:在过去的几个月里,竞争对手的视频生成模型“已经夺走了Sora发布的光彩”。
无论是因为Sora的迟到,还是因为网友的高期望,预期的惊艳和惊喜并未出现,一片吐槽声中,中国的可灵、海螺AI以及混元反而意外胜出。
AI视频生成领域的竞争
但是,仅凭Sora发布两天来的吐槽就否定其价值,未免过于草率。
使用过视频生成应用的用户都知道,AI视频的连续性很差,单次生成的通常只是一个画面或一个意群,能够承载的信息量有限,距离完整的影片还有很长的路要走。
在Sora发布直播中,OpenAI也明确表示:“如果你认为只需点击一个按钮就能生成一部故事片,那么你可能对Sora抱有错误的期望”。
丨OpenAI发布Sora前的预告,画面精美,想象丰富
事实上,国内外Sora的竞品如Runway、Luma、可灵、海螺、即梦、Vidu等,都有各自的特色,很难说哪个产品具有绝对的领先优势。
有深度创作用户在评价这些工具时表示:从电影制作的角度来看,可灵的现实效果最实用,海螺在某些情况下表现不错,但水平不一致;Runway更适合制作大场面,即梦适合制作人物,Vidu生成的二次元视频比其他工具要好。
因此,目前深度创作用户通常不会只使用一种工具,而是根据不同的场景选择不同的工具组合。
正因如此,我们认为,AI视频生成领域的竞争不仅仅是生成画面的单一维度,而是在于:
谁能够更好地赋能普通创作者,在可控性与效果、易得性与门槛、便捷性与工作流上,更好地满足和服务创作者,谁就能赢得这场竞争。
而目前,竞争还处于早期阶段,技术仍在持续迭代发展中。
结 语
丨OpenAI发布会直播
OpenAI的系列发布仍在继续,从首日的o1模型和ChatGPT Pro版本,到强化微调技术,再到Sora和Canvas,热度一路飙升,争议与讨论并存。
距离ChatGPT发布已经两年了。
两年间,ChatGPT逐渐被其他产品追赶甚至超越,光环逐渐褪去;ChatGPT Search没有引起太大反响;Sora引发了系列直播以来声量最大的吐槽;“宫斗”后一年来,包括首席科学家伊利亚在内的大批核心员工离职……OpenAI始终处于媒体的聚光灯和舆论的风暴眼中。
同时,传统巨头和AI新贵也在争相发力AI,技术不断迭代,产品层出不穷,新的观点、新的路线、新的尝试也一直在路上。
日新月异、唯变不变,新和变是这两年来的关键词。
既然如此,且不说OpenAI是否优势不再,即使真的不再,那又何妨?谁能一直独领风骚?最重要的是,对更广大的用户和市场而言,一个竞争更充分、更多元化的AI发展生态,不是比一枝独秀、唯我独美的生态更健康、更安全吗?
END