678CHAT AI资讯 AI女神们全军覆没:赛博照妖镜下现原形,AI 代码让美女照变鬼

AI女神们全军覆没:赛博照妖镜下现原形,AI 代码让美女照变鬼

在数字世界的镜厅中,AI 艺术家们绘制的肖像画正逐渐模糊了真实与虚构的界限。

AI女神们全军覆没:赛博照妖镜下现原形,AI 代码让美女照变鬼插图

让我们聚焦于这些作品的微妙之处。

将色彩饱和度调至极限,AI 创造的肖像画中的牙齿细便开始变得扭曲,轮廓变得模糊,而整体画面的色彩却依旧和谐。麦克风的细节更是显得异常。

反观真实人物的照片,牙齿的轮廓清晰可见,画面中的色块分布均匀,没有丝毫的不协调。

这项技术现已向公众开放,任何人都可以上传照片进行测试。即使是AI生成视频中的单帧画面,也难逃法眼。

即便是那些没有露出牙齿的照片,同样能够揭示出端倪。

顺便一提,这一工具是由 Claude 所开发,用 AI 技术来识别 AI 创作,形成了一个奇妙的循环。

事实上,近期 AI 肖像的逼真程度引发了广泛讨论,例如一系列广受欢迎的“TED 演讲者视频”,实际上并无真人参与。

不仅面部特征难以辨认,甚至之前 AI 在书写方面的不足,现在也变得难以区分真伪。

更关键的是,创建这样的 AI 肖像的成本并不高昂。仅需短短5分钟,每20秒的成本大约1.5美元(约合人民币10元左右)。

这引发了网友们的热烈讨论,近5000人参与讨论,试图辨别两张图片中哪一张是真实的人物。

他们提出的论据多种多样。有人指出文字和图案的细节过于抽象,有人则认为人物的眼神缺乏生气……

AI 创造的肖像画的规律,正在被大家逐渐掌握。

细节之外,真伪难辨

综合来看,调整饱和度可能是目前最快捷的识别方法。在这种方法下,AI 群像的缺陷被暴露无遗。

然而,这种方法存在一个问题。如果图片经过 JPEG 压缩算法处理,这种方法可能就不再有效。

比如确定某张照片是真实的人物照片。

但由于画质压缩和光线等因素的影响,人物的牙齿也显得有些模糊。

因此,网友们还提出了其他一些辨别 AI 合成肖像的方法。

第一种方法,简单来说,就是依靠人类的直觉和知识来判断。

由于 AI 学习图像的方式与人类存在差异,它无法完全掌握人类视角下的视觉信息,这导致了 AI 生成的图片常常包含与现实世界不符的元素,为图像的鉴别提供了线索。

以文章开头的图片为例。

从整体上看,人物的皮肤异常光滑,没有任何毛孔,这种过于完美的特征反而增加了不真实的感觉。

当然,这种“不真实感”并不完全等同于“造假”,因为经过磨皮处理的图片同样可能没有毛孔。但这并不是唯一的判断依据,AI 在图片中留下的常识性错误也不止一处。

实际上,只要仔细观察这张图的细节,就能发现一个明显的特征 —— 胸牌上方的挂钩连接方式非常奇特。

还有在高饱和度模式下暴露问题的麦克风,放大后用肉眼也能看出问题。

更为隐蔽的是,头发末端有几根毛发的位置不合理,但这样的细节可能只有拥有超凡视力的人才能察觉。

随着生成技术的进步,能够发现的特征越来越隐蔽,这已成为不可避免的趋势。

AI女神们全军覆没:赛博照妖镜下现原形,AI 代码让美女照变鬼插图1

另一种方法是观察文字,尽管 AI 在字形的刻画上正在逐渐克服“鬼画符”的问题,但正确渲染出具有实际意义的文字仍然存在困难。

例如,有网友发现,照片中人物佩戴的胸牌上,Google 标志下方的最后一行文字中的两个字母是“CA”,代表美国加州,而前面的一串文字应该是城市名。

但实际上,加州并没有如此长名字的城市。

除了物体本身的细节,光线、阴影等信息也可以用来辨别真伪。

这张图片是从视频中提取的,在视频中还有这样一帧。在话筒右侧的位置,有一片非常奇怪的阴影,这片阴影对应的是人物的一只手,显然 AI 在这里处理得不够完美。

说到视频,由于涉及内容的连贯性,AI 在视频中比在静态图像中更容易暴露问题。

还有一些特征虽然不算“常识错误”,但也反映了 AI 在生成图像时的一些倾向。

比如这四张图,都是 AI 合成的“普通人”肖像,有没有发现它们的共同点?

有网友指出,这四张图中的人物没有一个是面带微笑的,这似乎反映了 AI 生成图像的某种特征。

就这几张图而言确实如此,但这种判断方式很难形成系统,毕竟不同的 AI 绘图工具,其特点也各不相同。

为了应对日益进步的 AI,一方面可以加大观察细节的力度,另一方面还可以利用图像处理技术,如提高饱和度等。

但如果这样的“量变”积累得越来越多,肉眼判断也会越来越困难,图像饱和度也可能有被 AI 破解的一天。因此,人们也在转变思路,考虑使用 AI 生成的图片来训练检测模型,从图像中分析更多特征。

例如,AI 生成的图像在频谱、噪声分布等方面存在许多特点,这些特点肉眼难以捕捉,但 AI 却能清晰识别。

当然,也不排除检测方法落后、跟不上模型变化,甚至模型开发者专门进行对抗性开发的可能性。比如前文讨论的图片,某 AI 检测具认为它是 AI 合成的概率仅为 2%。

但 AI 造假与 AI 检测之间的博弈,本身就是一场“猫鼠游戏”。

因此,在检测之外,可能还需要模型的开发者承担一些责任,比如给 AI 生成的图片添加隐形水印,让 AI 造假无处藏身。

AI 的技艺日益精进

值得一提的是,那些引发恐慌的 AI 肖像,很多都是由最近非常受欢迎的 Flux 生成或参与制作的。甚至人们已经开始默认,难以分辨效果极佳的肖像就是 Flux 的作品。

它由 Stable Diffusion 的原班人马打造,发布仅 10 天就在互联网上引起了巨大反响。

这些精美的假 TED 演讲照片,都是 Flux 的杰作。

还有人结合 Flux 和 Gen-3 制作了精美的护肤品广告。

以及多角度的合成效果展示。

Flux 很好地解决了 AI 绘画和 AI 生成图片中的文字问题。

这直接导致现在人类在区分 AI 绘画时,不能再简单地看手和文字,而必须寻找那些细微的线索。

Flux 显然在手部、文字等细节上加强了训练。这也意味着,如果当前的 AI 继续在纹理细节、色彩等方面进行深入训练,下一代 AI 绘画模型出现时,人类的辨认方法可能再次失效……

而且 Flux 还是开源的,可以在笔记本电脑上运行。许多人已经开始忘记 Midjourney 了。

从 Stable Diffusion 到 Flux,只用了 2 年时间。从“威尔史密斯吃面条”到“TEDx 演讲者”,只用了 1 年时间。

真的很难想象,未来为了区分 AI 生成的作品,人类将想出哪些新的策略……

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/1537.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部