记忆aid：吊打Midjourney！OpenAI秘密内测新平台

Midjourney2yrs ago (2024)update lida

147 0 0

文章主题：OpenAI, 新平台, AI图像生成, Midjourney

吊打Midjourney！OpenAI秘密内测新平台

作者 | 徐杰承

在尝试使用过Midjourney之后，我对该产品的兴趣已经荡然无存。这句话出自一位OpenAI新图像生成平台的内部测试者。这显然预示着OpenAI有备而来，他们的目标直指AI图像生成领域。

MattVidPro,一位知名的YouTuber,最近分享了一段令人兴奋的视频。据他透露,他的一个粉丝有幸获得了OpenAI新图像生成平台的内测资格,并分享了一些利用该平台创作的作品。为了展示这些令人惊叹的艺术品,MattVidPro将它们制作成了一期视频节目,并在开头说道:“今天,我们将一起探索AI生成图像的无限可能性!”

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：Youtube

1、两大优势完胜Mj

MattVidPro在视频中透露，有粉丝透露，OpenAI正悄然测试一款全新的图像生成平台。这款平台有可能就是之前发布的文生图工具Dell-E 2的升级版。此次测试过程异常低调——用户需在OpenAI专属的仅限400人的测试服务器上访问此平台。

在经过一段时间的努力探索之后，该粉丝得出了一个令人惊喜的结论：新平台在创建包含头发、灯光、广告副本等详尽细节的逼真图像方面表现卓越；同时，它在生成连贯细节和遵循提示词方面也展现出了超强的能力。事实上，在新平台的执行效果上，它甚至在当前AI生成图领域最具知名度的Midjourney之上。

在连贯性细节方面，对于熟悉AI图像生成模型的读者来说，众所周知，大部分此类模型都难以精确地处理生成的图像中的文字内容。同样，Midjourney也存在这个问题。举例来说，一个源自网络的案例是：“生成一支红色铅笔，其上印有‘欢迎’的字样。”尽管Midjourney成功地生成了红色铅笔，但在文字显示效果上，其表现堪称一团糟。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：网络

然而，显而易见的是，OpenAI已经找到了应对此问题的策略。在MattVidPro展示的图片中，新平台在执行类似任务时展现出了令人惊叹的能力。无论是生成带有博主ID的海报，还是创建《GTA5》游戏盒子的全面版本，新平台都能轻松应对，且图像中的主体文字内容完全无误。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：Youtube

除此之外，在面对较为复杂的提示词时，相比于Midjourney，OpenAI新平台所生成的图像内容显然更接近提示词的描述。这里一个典型的例子是根据以下提示生成图像：“在一场自行车比赛中，一名粉色小丑正在与一只熊猫击掌。自行车是由奶酪制成的，地面非常泥泞。他们在一个多雾的森林里骑车，熊猫很生气。”

在Midjourney所给出的四张作品中，一只熊猫没有骑车，而其余三只的座驾都是没有出现奶酪元素的摩托而非自行车，并且四张图片中均没有出现小丑角色，熊猫的表情看起来也与生气毫不沾边。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：Youtube

而OpenAI平台在相同任务上的表现则无需多言，所生成作品包含了提示中的几乎全部细节。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：Youtube

看完以上案例，有人可能会说OpenAI新平台生成的图像似乎在真实度和画面细节方面并不出彩，甚至有些依靠“Q版”图耍小聪明的嫌疑。但这其实只是由于在提示中未规定画面风格的缘故。在生成写实图像方面，新平台的能力也完全不亚于目前的主流文生图工具。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：Youtube

在以上的两个案例中，我们不难看出，无论是油画风格图像“公牛”的画面质感和笔触细节，亦或是写实风格图像“水中少女”的光效、少女面部的水渍呈现等，两幅图像的逼真度和细节处理也均达到了业内顶尖水准。

2、或采用全新生成模型

除了图像以外，关于OpenAI正在测试的这个新图像生成平台，网上几乎没有出现其余的任何消息。但根据OpenAI于3月所发表的论文，不少专业人士推测，该平台很可能利用了全新的“一致性模型”而非目前业内主流的“扩散模型”。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：OpenAI

在这篇名为《Consistency Models》的论文中，OpenAI提到，一致性模型在训练速度上覆盖了扩散模型，能够“一步生成”，能够比扩散模型更快实现简单任务，且所用计算量要少10-2000倍。此外，一致性模型也允许“多步采样”，以计算换取样本质量。因此即使没有迭代过程，一致性模型也可以产生高质量结果，并能快速适用于实时任务。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：OpenAI

与扩散模型相同，一致性模型也支持零样本数据编辑。例如在修补、着色或超分辨率任务中，一致性模型可以从预先训练的扩散模型中提取数据，也可以单独进行训练。根据OpenAI的说法，一致性模型能在所有非对抗性单步生成任务中胜过扩散模型。

记忆aid：吊打Midjourney！OpenAI秘密内测新平台图源：OpenAI

并且以上所提到的两种训练方式都将“对抗训练”从中删除了。这是由于对抗训练过程较为复杂，虽然这更易于产生强大的神经网络，但对抗训练的方式也会导致模型预测的准确率下降。部分业内人士认为，这便是OpenAI新平台能够在处理连贯任务和遵循提示方面表现得更好的主要原因。

除此之外，一个没有太多依据的猜测是，在Dall-E 2发布的几个月前，OpenAI发表了几篇关于扩散模型的论文。如果从时间维度推测，新平台则很可能利用了全新的一致性模型。当然，以上这些也只是目前业内的普遍猜测，在OpenAI官方发声之前，估计我们也很难了解到更多关于该平台的技术细节。