Midjourneyv5.2版本更新:创新功能与性能飞跃
文章主题:AI图像生成工具, Midjourney, v5.2版本更新, 图像填充功能
在6月23日的清晨,全球著名的AI图像生成工具Midjourney正式发布了备受期待的第5.2版更新。自从上一个版本推出至今已经过去了一个月有余,这段时间内,AI技术和图像生成工具行业的竞争愈发激烈。尤其是Photoshop等软件,它们在AI功能上的表现尤为突出,赢得了业界的普遍好评。面临这样的竞争压力,Midjourney并没有气馁,而是通过引入新的功能和优化原有的功能,进一步强化了自身在行业内的领导地位。本文将会深入剖析这次更新的内容,解析它与前版本的差异,以及体验Midjourney的最新功能和性能。
在开始之前,让我们先进入Discord平台,然后在Midjourney设置界面中,将生成模型的版本更新至5.2版本(请注意,此功能目前仅限于付费用户。有关购买指南,请自行查询,我国市场上也提供代充服务)。
在本次的升级中,我们为用户带来了众多实用且创新的新功能,旨在提供更加丰富的交互体验。首先,我们对应用的美学风格进行了全面升级,使其看起来更加美观大方。同时,我们也解决了风格化命令存在的问题,使用户在使用过程中能够更加流畅。此外,我们还新增了高变异模式,以满足用户的多样化需求。此功能的加入使得我们的软件能够更好地适应各种设计场景。为了让用户能够更深入地理解设计元素,我们还提供了提示词分析功能。这一功能可以帮助用户更好地把握设计的核心要点,提升他们的设计效率。最后,我们还增加了具有针对性的图片填充功能,使其与PSAI等专业的图像处理软件相媲美。总的来说,这次的更新我们在保持原有功能的基础上,通过引入新的美学风格、解决风格化命令问题、新增高变异模式、提供提示词分析功能以及增加具有针对性的图片填充功能等方式,极大地丰富了用户的使用体验,提高了他们的设计效率。
MidjourneyV5.2
在接下来的步骤中,我们将采用5.1版本与5.2版本进行对比,以生成具有全新美学风格设计的相同Prompt内容。在此过程中,我们选择了一个人像案例进行模拟胶片质感的测试。图示中的Prompt即为我们要对比的内容。
MidjourneyV5.1
MidjourneyV5.2
在两组照片中,我们都成功地突显了关键词所包含的内容。然而,在光影细节以及画面内容的生成(例如车辆)方面,新版本展现出了显著的进步。然而,手部细节仍然存在一些问题,这些问题不容忽视。
在接下来的步骤中,我们将进行一场有关物品的AI生成测试。考虑到DIY频道倾向于拆解硬件,因此我们利用AI生成了硬件的平面拆解图。具体的提示信息如下:
MidjourneyV5.1
MidjourneyV5.2
这一组作品的对比充分体现了AI在还原较为复杂物品图像方面的局限。尽管两个版本的AI都试图还原一个“他们眼中电脑内部”的样子,但实际生成的图像在质感上虽达到摄影级,内部构造却与真实电脑相差甚远。相较之下,5.2版本在还原细节方面更加真实。
最后一组对比聚焦于中国传统山水画,以探讨两者在解析传统艺术方面的表现。Prompt如下:
MidjourneyV5.1
MidjourneyV5.2
虽然我对艺术的了解有限,但这两张图片在第一眼看上去都颇具观赏价值。宁静致远的场景与国画中简练的笔触相得益彰。然而,两者仍存在过多细节,缺少了传统山水画中留白的意境。5.2版本在构图平衡感上更出色,其背景山峰的层峦叠嶂感也更具美感。
下面是我从MJ官方论坛和一些爱好者的发布内容中选取的v5.2版本Ai生成图像:
MidjourneyV5.2
MidjourneyV5.2
MidjourneyV5.2
MidjourneyV5.2
第二个重要的更新便是与PhotoShop前段时间推出的Ai拓展图像一样的图片填充功能。
用户可以通过指令来调整图片,这些命令主要用于调整图像尺寸和填充细节。”[ZoomOut1.5x]”和”[ZoomOut2x]”分别表示将图像缩小到原来的1.5倍和2倍,并在四周填充相应的细节。”[MakeSquare]”命令用于将非正方形图像变为正方形,通过在两侧添加细节实现。”[CustomZoom]”是一个高级功能,它会弹出一个文本框,允许用户在缩小图像的同时,自定义更改提示词、宽高比或精确缩小比例,以便更好地满足个性化需求。
接下来我们测试一下基于这张“战斗海狸鼠”看看Ai能够拓展出什么意想不到的图片出来,首先是1.5X的缩放。
嗯,场景感出来了,接下来是2X的缩放。
阴暗的天空,合适的背景虚化,主角左边的道具,水中的倒影,非常出色的拓展表现,最后我们再来测试一下进行一下自定义的拓展。我们可以对原来的Prompt进行修改,并修改尺寸等。我们增添了一个关键词是“一个大型的盒子里面”,意思是这只小耗子周围的场景都处于一个盒子中,看看Ai能否正确识别并理解并画出来。
看来它并没有理解“盒子”的概念,但仍然通过创意打造了一个较为惊喜的画面场景。
接下来看一下Ai爱好者们的实际案例:
——————————————
——————————————
——————————————
——————————————
通过我们的实际测试和案例分析,MidjourneyV5.2的缩放填充功能表现出色,与Photoshop中的AI填充技术相媲美。然而,MidjourneyV5.2的局限性在于它目前仅能对AI生成的图像进行填充处理,无法对现实拍摄的照片或其他来源的图像进行缩放填充,而Photoshop则可以实现这一功能。
AI图像填充本质上利用了类似于OpenAI的DALL-E所描述的外部绘制(outpainting)技术,根据简单的文本提示快速且无损地添加或删除图像内容,同时自动匹配图像中的透视、光线和风格。这为编辑者提供了快速尝试和迭代不同创意概念的能力。
MidjourneyV5.2
接下来我觉得对用户蛮重要的更新点是新的/shorten命令,这让你可以“简化”一个提示,得到关于哪些词可能没啥用和哪些词可能关键的建议,这个对优化提示词非常重要。首先我们写一个非常冗长的Prompt丢给Midjourney,看看它能怎么优化。
优化结果,分成了逐渐减少关键词的五条建议:
点击showdetails可以显示提示词中每个词的具体权重。
我们来看看其优化后的Prompt的生成结果到底如何,首先是未经优化的长文本Prompt:
MidjourneyV5.2
然后是经过优化后的第一条Prompt,拥有与原文相似的关键词矩阵,但简化了内容,只保留了机器能读取的信息:
MidjourneyV5.2
接着是经过简化后的最后一条Prompt,只保留了画面最重要的主体信息和绘画风格描述:
MidjourneyV5.2
从实际效果来看,经过简化后的第一个Prompt(带有许多细节描述词)的会更加出色,出图效果也最满足我的本意。
总结,Midjourneyv5.2的更新在功能和性能方面都取得了显著的进步。尤为突出的是,其针对性图片填充功能与Photoshop的AI工具相媲美。然而,得益于不断的技术创新与迭代,Midjourney在未来版本中仍具有广阔的提升空间。相较于Photoshop和其他竞品,Midjourney在简化使用与操作方面仍有待加强。我们期待V6版本能够推出更加用户友好的客户端App,不仅局限于Discord上的体验。
丰富的用户群体创意,才是Ai发光发热的基础
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!