文章主题:验证, Midjourney 5.1, 表现, 文字提示词
IT之家 5 月 4 日消息,AI 作图工具 Midjourney 近日发布了最新的 5.1 版本,宣称能够为用户带来更高质量、更有个性的 AI 艺术作品。
Midjourney 是一家提供生成式 AI 艺术服务的公司,用户只需在 Discord 上输入一些文字或图片,就可以让 AI 根据自己的喜好和风格创作出独一无二的艺术作品。Midjourney 的引擎经过多次升级,目前已经达到了 5.1 版本,据官方介绍,这一版本的引擎更加“有主见”,能够生成出更接近 4.0 版本的效果,但质量更高。此外,还有一个“原始”模式,供那些不想要太强个性化效果的用户使用。其他方面的改进包括:准确度提高,图像中不想要的边框减少,文字失真情况减少,锐度增强。
为了检验 Midjourney 5.1 版本的性能,知名的外媒 Forbes 利用相同的文字提示词,在 5.0 和 5.1 两个版本中分别生成了四张图片并进行对比分析。在此过程中,其余所有设置均保持一致,仅 Midjourney 设置为基础质量和中等风格。IT之家提醒读者,以下图片中的左四张为 Midjourney 5.0 版本的结果,右四张则是 5.1 版本的结果。
第一个提示词是“女人走在鹅卵石街道上,走向日落”:
在Midjourney 5.0版本中,一直存在着一个显著的问题,即过度强烈且不真实的镜头光晕效果。然而,在5.1版本中,这一问题终于得到了妥善解决。改进后的日落画面显得更为自然,同时天空也呈现出更加温馨和有趣的色调。
第二个提示词是“油漆厂爆炸,矢量艺术”:
同样地,5.1 版本的图片比 5.0 版本的更出色,颜色运用得更好,构图也更有动感。
人脸是 Midjourney 的一个强项,下一张图片的提示词是“戴着泳镜的孩子的特写”:
在Midjourney 5.1版本中,我们可以明显感受到其“主见”特性的提升。相较于5.0版本中较为普通的图片,5.1版本的图像质量有了显著提高。它不再仅仅是孩子戴着眼镜的普通照片,而是具有更强烈艺术感的作品,仿佛出自专业摄影师之手。这样的改进无疑让Midjourney 5.1版本更具吸引力。
在最终的测试中,5.1 版本的性能表现得到了验证,其确实能够有效地解决文字失真的问题。这一点从“街角卖报纸的人,1950 年代风格,棕褐色”这个提示词就能看出。
两个版本都未能准确理解提示词的含义,所生成的场景均呈现出一名持有报纸的推销员,而非真正售卖报纸的角色,这方面的修正可以通过调整提示词来实现。在两组图片中,背景均存在文字元素,但彼此间并无显著差异。从整体来看,两组图片中的文字尚可,然而,一旦放大观察,便会发现其中大部分文字并无实际意义。相较于5.1版本,其图片构图更为强烈,主题在画面中所占空间也相对较大。
目前,Midjourney 5.1 版本仍在测试阶段,但用户已可通过在Discord上输入 /settings 命令选择使用此版本。据公司计划,Midjourney 5.1 将在本周末前成为默认模式。
验证, Midjourney 5.1, 表现, 文字提示词
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!