MidjourneyV6：深度解读其AI技术的突破与进步

Midjourney2yrs ago (2024)update lida

133 0 0

文章主题：Midjourney V6, 内测更新, AI, 图像生成

上周周四，期待已久的Midjourney V6终于进行了内测更新。自从V5.2版本更新以来，这个小型团队似乎陷入了沉默，数月未见任何动作。业内纷纷猜测，这个拥有十几个成员的团队是否已经赚得盆满钵满，因此选择集体度假？然而，事实并非如此简单。

Midjourney V6生成丨图片源自互联网

原内容虽然简洁，但仍有一定的信息量。我们可以尝试通过调整句子结构，增加细节描述等方式，对这些信息进行更深入、详细的表达。以下是一种可能的改写方式：在12月初的动态发布会上，Midjourney的负责人详细介绍了V6的升级计划，并明确表示将在圣诞节之前为大家带来一份特别的惊喜。因此，我们可以在12月21日如约收到了这份“AI圣诞礼物”。无需过多废话，让我们直接深入体验并分享我的几天使用心得，详细解释V6版本更新内容以及其操作技巧。

图片源自互联网

1.细腻，还是细腻，真实，还是真实

V6版在数据源和算法方面都进行了显著优化，使得生成的图像更加逼真、精细，且细节丰富。在材质、人物肖像以及光影效果的刻画上，它实现了深度的优化，从而提升了图像的整体质感和真实度。

Midjourney V6生成丨图片源自互联网

　　以下是我自己画出来的，或者搬运社区中的优质图片，大家可以看看V6的效果。

Midjourney V6生成丨图片源自互联网

Midjourney V6生成

2.更加契合提示词，更加准确

V6版本在处理用户输入的提示方面有了显著的提升，能够应对那些精确度相对较低的词汇，并且支持的有效字符长度已经超过350个。

在对比实验中，当我们请求绘制一尊雕像时，V5.2版本的模型可能会无法精确捕捉到用户的需求，从而生成了一个机器人形象。然而，在V6版本中，同样的提示下，该模型能够更为精准地领悟并创作出用户所期望的雕像内容。这表明V6版本在理解与生成指定对象方面具有更高的准确性。

Midjourney V5.2生成

Midjourney V6生成

为检验V6对长文本的理解输出能力，我特意挑选了几段名著的场景描述译文进行测试。尽管画面呈现出一种CG渲染的风格，但整体效果相当出色。这不仅因为它忠实地还原了文本描述，还因为它巧妙地捕捉并呈现了关键元素，展示了V6在复杂指令处理上的卓越技巧和表现力。

Midjourney V6生成

3.prompt再优化，想画直接写

许多朋友都曾抱怨过Midjourney的语义理解能力，尤其是它那复杂的关键词系统。要使模型达到最佳效果，我们需要用到诸如“ photorealistic”、“4k”、“8k”等词汇。然而，随着V6更新的到来，Midjourney V6 Beta在语义理解方面有了显著的提升，这使得它在一定程度上变得可靠。尽管如此，与依赖于OpenAI的Dalle-3相比，它仍稍显不足。

Dalle-3支持中文输入，且可以指定车型，但画面效果不如MJ

在Midjourney V6中，用户们不再需要添加诸如“获奖”、“超现实”、“4k”、“8k”等无意义的标签，他们可以直接描述自己想要的绘画内容，并将其翻译成英语。然而，如果用户希望获得更为专业和高大上的图片，他们仍需遵循一套全新的提示方法论。

　　风格：指定所需的审美或艺术风格，包括时代和风格偏好。

Midjourney V6生成

　　主题：明确定义图像的中心主题，细节涵盖人物、物品、动物的外观、颜色和独特属性。

Midjourney V6生成丨图片源自互联网

　　背景：设定主题的环境，包括地点、环境元素、一天中的时间和天气。

Midjourney V6生成

　　构图：决定画面的布局，包括视角、角度和构图偏好。

Midjourney V6生成丨图片源自互联网

　　灯光：设定图像的情绪和视觉基调，选择照明类型和大气效果。

Midjourney V6生成丨图片源自互联网

　　额外信息：添加图像的次要元素，描述它们与主题的关系和位置。

Midjourney V6生成

4.可以写字了！虽然仅限英文

　　Midjourney V6 新增了对英文文本插入的支持，但这一功能仅限于添加少量字符，并不足以创作完整的英文小说。Dalle-3较早前已实现了这一功能。尽管如此，对于Midjourney来说，这依然是一个重要的进步。

Midjourney V6生成

　　用户可以在文本框中使用引号标出所需添加的文字，这样就能产生一个包含准确文本的、效果相当不错的图片。

Midjourney V6生成

5.真实到感觉分分钟侵权

　　根据部分AI绘画爱好者的反馈，越来越多的人发现，Midjourney V6之所以能够拿出极其逼真的图画，可能是因为它的训练来源已经深入到了影视作品的每一帧画面上，而且并不掩饰生图时的一致性。

Midjourney V6生成丨图片源自互联网

　　例如，Midjourney V6所创造的动画和漫画风格图像，在细节上与原始作品极为吻合，这暴露了当前人工智能绘画技术在版权合规方面的模糊边界。目前尚无专门机构负责审核人工智能训练用数据集的版权合法性，这为企业在版权法的监管空白区域中提供了操作的余地。

Midjourney V6生成丨图片源自互联网

　　这进一步引发了一个尚未解决的问题：人工智能学习并再现现有艺术作品，是否应当被认为是一项合法权利。鉴于利益相关方的多元性和问题的复杂性，围绕这一议题的讨论可能难以达成共识，未来需要更多的研究机构与立法部门来对此进行针对性的规范。

Midjourney V6生成丨图片源自互联网

　　目前，Midjourney V6正处于内测阶段，模型的统一性与完整程度仍在优化中，相信在正式版放出之时，会有更多的惊喜内容等待着我们，包括更加细致的局部重绘功能以及更好的字体可控性。

举报/反馈

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

# Midjourney # # AIGC # ChatGPT # DALL-E # Prompt # 互联网

文章版权归作者所有，未经允许请勿转载。

ChatGPT超能力揭秘：如何让文本模型工作得像Excel一样？✨Markdown表格、图片制作、

lida

203

🔥如何让外呼更精准？火山引擎&VeCDP的联合秘密！高效率+个性化，让你的营销火力全开！🔥

lida

141

一站式IT管理与办公安全平台：火山引擎飞连升级助力企业数字化转型

lida

121

10问百度文心一言！确实不完美，但还没那么差

lida

181

服务

lida

160

70多种插件加持，联网版ChatGPT评测来了穿浴巾、内衣外露，聂小雨拜师小杨哥，为博流量已经不择手段？

lida

167

No comments

No comments...

MidjourneyV6：深度解读其AI技术的突破与进步

Midjourney完全教程：从基础理论到实战应用

AI绘画工具MidjourneyV6推出新版本，引发对版权问题的讨论

Related posts

No comments