MidjourneyV6Beta:超越阿尔法测试的AI图像革命

Midjourney1yrs ago (2024)update lida
99 0 0

文章主题:Midjourney, V6 Beta, AI绘图, 图像质量

666ChatGPT办公新姿势,助力做AI时代先行者!

在圣诞节假期的前夕,Midjourney 发布了全新的 V6 beta 版本。北京时间下午 13:56,这个时间点正值美国之夜间的十点钟。

他们是想趁着还没回家过圣诞,赶紧先发了。然后让大家一边过圣诞,一边给他们打黑工帮他们测模型。

现在,你使用/setting命令,在模型选择框中,就可以看到V6 Beta版。

Midjourney曾表示:“这是一次alpha测试。事物将会频繁且不可预测地发生变化。”

“这是一个阿尔法测试。事情会经常发生变化,恕不另行通知。”

包括提到了“速度、图像质量、连贯性、提示跟随性和文本准确性将在接下来的几周内得到改善。”

我猜测模型完成度在85%左右,剩很多对齐工作没搞完。

官方说的目前V6 Beta的更新内容包括:

1. 更准确的提示跟随以及更长的提示;

2. 提高连贯性和模型知识;

3. 改进的图像提示和重新混合;

4. 较小的文本绘制能力(必须将文本写在“引号”中,并且 –style raw 或较低的 –stylize 值可能会有所帮助。)

5. 改进的升级器,具有 subtle 和 creative 模式(分辨率提高 2 倍)

在改进之后,这款软件的表现有了显著提升。它能够处理更多的词汇,从而提高了语言理解的准确性;同时,它的图像识别能力也得到了增强,使得识别出的图片更加清晰明确。此外,该软件还能够插入一些英语单词,这为用户提供了更多的表达选择。另外,这款软件还能将图像放大到更大的尺寸,使用户可以更直观地观察细节。总的来说,这些改进让这款软件在许多方面都表现得更加出色。

我跟上百个群友一起跑了三个多小时,整体感受最大的变化其实还是两部分:

图像质量的提升与语义理解的加强。

一、图像质量的提升 

图像质量我关注的是以下几个维度:细节密度、材质质感、色彩表现、光影表现、构图表现、结构真实性。

在Midjourney V6 Beta版本中,我们可以明显地看到在细节密度、材质质感、光影表现以及结构真实性方面都取得了显著的提升。与此同时,在构图表现和色彩表现方面也实现了小幅度的提升。这些改进不仅让作品的整体质量得到了提高,同时也为用户提供了更加真实、立体的视觉体验。

直接放对比图,没啥可说的了,部分图片来源于好基友@鲜虾包、@猫宅V酱、@大峰AI绘画。

就不放太多了,反正核心思想就一个:图像质量up、up、还是up。

知道在细节密度、材质质感、光影表现、结构真实性上,都有巨幅提升就行了。

下面一趴的语义理解才是最核心的重点。

二、语义理解的加强 

我重点来聊聊语义理解这块的变化。

在过去的一段时间里,我曾公开地对Midjourney表示过不满,将其视作一种令人费解的的存在,其词义理解仿佛只是一堆混乱的排泄物。在我进行AI创作的过程中,这句话无异于一颗重磅炸弹,让我在每一次尝试中倍感压力,甚至想要摔掉手中的电脑。

然而,在Midjourney V6 Beta中,对于语义理解的精确提升终于使其在中游水平上变得可用。这里,我特别强调了“可用”这个词,因为它准确地描述了该软件在语义理解方面的进步,而与DALL·E 3等顶级技术相比,仍存在一定的差距。

在开始写作之前,我建议您暂时抛开所有刻板的模式,尤其是那些带有SD标志的写作方式,同时避免使用诸如“tag”、“photorealistic”以及“4k”、“8k”等无意义的词汇。这些词汇在新版V6 Beta中并未发挥任何实质性的作用,因此对于您的写作来说并无帮助。

不要写tag,不要写tag,不要写tag,重要的话我说3遍。

更别直接用v5.2的prompt直接拿来复制粘贴,请重新学习新版V6的写法。

整体上,我觉得更强调把细节说清楚的能力。我推荐的结构是:

场景+主体+细节+美学风格。

比如我的这段Prompt

在这美丽的沙滩上,三位各具魅力的女士正悠然地享受着阳光的沐浴。其中一位金发白人的女士,以其开朗的性格和迷人的容貌吸引了众人的目光。她身着一袭短裤和火红的背心,展现出无尽的活力与魅力。而左侧的非洲女孩则以黑色长发和时尚的比基尼裙装,展现出了独特的神秘气息。右侧的英国女孩也毫不逊色,同样选择了一身比基尼,搭配她的红发,增添了几分浪漫与优雅。在这如诗如画的背景下,她们仿佛是在诉说着一个个充满阳光、热情和友情的美好故事。而这一切,都被 Agfa Vista 200 相机记录下了美好的瞬间。海天相接的地平线上,几艘帆船如同小精灵般在海浪中穿梭,而空中,飞翔的海鸥则像是大自然的音符,弹奏出一曲曲动人的旋律。这就是生活,这就是友情,这就是我们的美丽世界。

非常复杂,但是我几乎都是以长句子去写的,清晰的描述场景和主体以及部分衣服细节。

再看看v5.2,可以就语义理解上,做一个清晰的对比。

在新版prompt的写法上,我说一些我认为有趣的技巧:

1. 你可以指定任何细节。

不要吝啬你的想象力,更不要吝啬你的笔墨,用一切有逻辑、有结构的语言,把你想要的细节指定出来。她穿了什么衣服、衣服是什么材质、什么颜色。写明白,写明白比一切都重要。

比如:

漫威黑寡妇的半身特写镜头。黑寡妇穿着蜘蛛侠的黑色紧身衣,她的左手拿着美国队长的盾牌,右手拿着雷神之锤,她很悲伤。–ar 16:9

2. 你可以使用语言控制构图。

在V6中,现在很容易用语义去定位事物之间以及与相机的关系。这个在V5中几乎是难以想象的。

现在我们可以用短语描述一个通用的图像,以这个通用图像为焦点。围绕它填充细节。

比如:

客厅的桌子上有三个装满水果的篮子。中间的篮子里装有草莓。左边的篮子装满了橘子。右边的篮子装满了芒果。背景是一个带有圆形窗户的空白蓝绿色墙壁。

3. 你可以向你的图像中添加文本。

DALL·E 3的老传统了。可以给你图像添加文本,将需要嵌入图片的文字放在 “引号”内,并且保证你描述的画面上适合嵌入文本。比如你非说要在她鼻子上写个“shabi”,那写不上去你也不能怪MJ对吧。

比如:

特朗普在苹果发布会上的特写镜头。他在人群中举着一块写着“SHABI”的牌子。

三、写在最后 

Midjourney V6 Beta带来的有趣是一定的,对真实感和图像质量的加强,基本到了现在所有AI绘图的颠峰,再配上独一档的审美,以及史诗级的语义增强。

可以看到,Midjourney未来正式版V6的推出,一定又会开始“遥遥领先。”

诚然,问题还很多,比如对于其他的风格加强好像并不明显。

比如很多功能都还不支持。

但是瑕不掩瑜。

Midjourney V6 不是AI绘图的最后一步。

而是又一次AI历史长河中的丰碑。

本文来自微信公众号:数字生命卡兹克(ID:Rockhazix),作者:数字生命卡兹克

MidjourneyV6Beta:超越阿尔法测试的AI图像革命

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© Copyright notes

Related posts

No comments

No comments...