MidjourneyV6:深度解读其AI技术的突破与进步
文章主题:Midjourney V6, 内测更新, AI, 图像生成
上周周四,期待已久的Midjourney V6终于进行了内测更新。自从V5.2版本更新以来,这个小型团队似乎陷入了沉默,数月未见任何动作。业内纷纷猜测,这个拥有十几个成员的团队是否已经赚得盆满钵满,因此选择集体度假?然而,事实并非如此简单。
Midjourney V6生成丨图片源自互联网
原内容虽然简洁,但仍有一定的信息量。我们可以尝试通过调整句子结构,增加细节描述等方式,对这些信息进行更深入、详细的表达。以下是一种可能的改写方式:在12月初的动态发布会上,Midjourney的负责人详细介绍了V6的升级计划,并明确表示将在圣诞节之前为大家带来一份特别的惊喜。因此,我们可以在12月21日如约收到了这份“AI圣诞礼物”。无需过多废话,让我们直接深入体验并分享我的几天使用心得,详细解释V6版本更新内容以及其操作技巧。
图片源自互联网
1.细腻,还是细腻,真实,还是真实
V6版在数据源和算法方面都进行了显著优化,使得生成的图像更加逼真、精细,且细节丰富。在材质、人物肖像以及光影效果的刻画上,它实现了深度的优化,从而提升了图像的整体质感和真实度。
Midjourney V6生成丨图片源自互联网
以下是我自己画出来的,或者搬运社区中的优质图片,大家可以看看V6的效果。
Midjourney V6生成丨图片源自互联网
Midjourney V6生成丨图片源自互联网
Midjourney V6生成
Midjourney V6生成
Midjourney V6生成
2.更加契合提示词,更加准确
V6版本在处理用户输入的提示方面有了显著的提升,能够应对那些精确度相对较低的词汇,并且支持的有效字符长度已经超过350个。
在对比实验中,当我们请求绘制一尊雕像时,V5.2版本的模型可能会无法精确捕捉到用户的需求,从而生成了一个机器人形象。然而,在V6版本中,同样的提示下,该模型能够更为精准地领悟并创作出用户所期望的雕像内容。这表明V6版本在理解与生成指定对象方面具有更高的准确性。
Midjourney V5.2生成
Midjourney V6生成
为检验V6对长文本的理解输出能力,我特意挑选了几段名著的场景描述译文进行测试。尽管画面呈现出一种CG渲染的风格,但整体效果相当出色。这不仅因为它忠实地还原了文本描述,还因为它巧妙地捕捉并呈现了关键元素,展示了V6在复杂指令处理上的卓越技巧和表现力。
Midjourney V6生成
3.prompt再优化,想画直接写
许多朋友都曾抱怨过Midjourney的语义理解能力,尤其是它那复杂的关键词系统。要使模型达到最佳效果,我们需要用到诸如“ photorealistic”、“4k”、“8k”等词汇。然而,随着V6更新的到来,Midjourney V6 Beta在语义理解方面有了显著的提升,这使得它在一定程度上变得可靠。尽管如此,与依赖于OpenAI的Dalle-3相比,它仍稍显不足。
Dalle-3支持中文输入,且可以指定车型,但画面效果不如MJ
在Midjourney V6中,用户们不再需要添加诸如“获奖”、“超现实”、“4k”、“8k”等无意义的标签,他们可以直接描述自己想要的绘画内容,并将其翻译成英语。然而,如果用户希望获得更为专业和高大上的图片,他们仍需遵循一套全新的提示方法论。
风格: 指定所需的审美或艺术风格,包括时代和风格偏好。
Midjourney V6生成
主题: 明确定义图像的中心主题,细节涵盖人物、物品、动物的外观、颜色和独特属性。
Midjourney V6生成丨图片源自互联网
背景: 设定主题的环境,包括地点、环境元素、一天中的时间和天气。
Midjourney V6生成
构图: 决定画面的布局,包括视角、角度和构图偏好。
Midjourney V6生成丨图片源自互联网
灯光: 设定图像的情绪和视觉基调,选择照明类型和大气效果。
Midjourney V6生成丨图片源自互联网
额外信息: 添加图像的次要元素,描述它们与主题的关系和位置。
Midjourney V6生成
4.可以写字了!虽然仅限英文
Midjourney V6 新增了对英文文本插入的支持,但这一功能仅限于添加少量字符,并不足以创作完整的英文小说。Dalle-3较早前已实现了这一功能。尽管如此,对于Midjourney来说,这依然是一个重要的进步。
Midjourney V6生成
用户可以在文本框中使用引号标出所需添加的文字,这样就能产生一个包含准确文本的、效果相当不错的图片。
Midjourney V6生成
5.真实到感觉分分钟侵权
根据部分AI绘画爱好者的反馈,越来越多的人发现,Midjourney V6之所以能够拿出极其逼真的图画,可能是因为它的训练来源已经深入到了影视作品的每一帧画面上,而且并不掩饰生图时的一致性。
Midjourney V6生成丨图片源自互联网
例如,Midjourney V6所创造的动画和漫画风格图像,在细节上与原始作品极为吻合,这暴露了当前人工智能绘画技术在版权合规方面的模糊边界。目前尚无专门机构负责审核人工智能训练用数据集的版权合法性,这为企业在版权法的监管空白区域中提供了操作的余地。
Midjourney V6生成丨图片源自互联网
这进一步引发了一个尚未解决的问题:人工智能学习并再现现有艺术作品,是否应当被认为是一项合法权利。鉴于利益相关方的多元性和问题的复杂性,围绕这一议题的讨论可能难以达成共识,未来需要更多的研究机构与立法部门来对此进行针对性的规范。
Midjourney V6生成丨图片源自互联网
目前,Midjourney V6正处于内测阶段,模型的统一性与完整程度仍在优化中,相信在正式版放出之时,会有更多的惊喜内容等待着我们,包括更加细致的局部重绘功能以及更好的字体可控性。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!