StableDiffusionXL1.0:革命的色彩体验
文章主题:关键词:Stable Diffusion XL 1.0, 文本到图像生成模型, AIGC 时代
编辑:蛋酱、梓文
Stable Diffusion XL 1.0 闪亮登场,给你不一样的色彩体验。
在AIGC时代的开启下,Stability AI这家明星AI初创公司所推出的文本到图像生成模型Stable Diffusion在全球范围内掀起了一股热潮。
尽管存在着从文本到图像的众多生成模型,但Stable Diffusion模型依然是最受欢迎的开源选择。众多开发者纷纷基于这一模型进行二次创作,从而推出了各种创新且富有创意的应用程序,呈现出多元化的特点。
最近,Stability AI 宣布推出了一款全新的产品——Stable Diffusion XL 1.0,这是一款先进的文本到图像生成模型,标志着其在进化过程中的又一次重要突破。
这是 Stability AI 最新的旗舰图像模型,也是当前图像生成领域最好的开源模型。
在 SDXL 1.0 版本尚未面世之际,Stability AI 于六月份发布的 SDXL 0.9 仅限于科研领域使用。然而,如今 SDXL 1.0 即将正式开源,可通过 Stability AI 的 API 供开发者使用。这样一来,普通用户也能借助消费级应用 Clipdrop 和 DreamStudio 来体验这一先进技术。
SDXL 1.0 是一款备受关注的深度学习框架,其凭借卓越的性能和广泛的应用场景赢得了广大开发者和工程师的关注。值得一提的是,由于与我方在业务上的紧密合作,SDXL 1.0 已经成功接入亚马逊云科技的基础模型托管服务 Amazon Bedrock,这无疑将为双方在人工智能领域的探索和发展提供更为强大的支持。此外,SDXL 1.0 的应用场景并不仅限于 Amazon Bedrock,它还将在 Amazon SageMaker JumpStart 平台上亮相。Amazon SageMaker 是亚马逊推出的一款人工智能服务,旨在帮助用户快速构建、训练和部署机器学习模型。而 SDXL 1.0 在 Amazon SageMaker JumpStart 平台上的应用,将会进一步拓展其应用范围,降低人工智能技术普及率和使用门槛,让更多企业和开发者能够从中受益。总的来说,SDXL 1.0 与亚马逊云科技的紧密合作以及其在 Amazon SageMaker JumpStart 平台上的应用,都充分展示了其在人工智能领域的重要地位和广阔前景。我们期待着与亚马逊共同推动人工智能技术的创新与发展,为广大用户提供更加智能化的服务和解决方案。
SDXL 1.0,什么进化了?
1. 生成概念与风格更具挑战的作品
SDXL 1.0是一款具有强大功能的图像生成器,它几乎可以创造出各种艺术风格的高质量图片,被认为是实现真实效果的最佳开源模型。该系统的一大特色在于其高度自由的风格生成,即使在没有特定灵感的情况下,也能生成独具特色的图像。此外,SDXL 1.0在色彩鲜艳度和准确性方面表现出色,其对比度、光线和阴影均优于上一代,且全部采用了原生1024×1024分辨率,从而确保了生成的图像质量。
除此之外,SDXL 1.0 可以生成图像模型难以渲染的概念,例如手、文本以及空间的排列。
图源:Stability AI 官网
图源:Stability AI 官网
2. 语言更简洁、更智能
SDXL 1.0 只需几句话就能创建复杂、细致、美观的图像。用户不再需要用华丽的辞藻进行修饰就能够获得想要的高质量图像。
它甚至能够区分「The Red Square」(红场,一个著名景点)和「red square」(红色正方形)。
3. 微调和高级控制
有了 SDXL 1.0 ,根据自定义数据对模型进行微调比以往任何时候都要容易。可生成自定义 LoRA 或检查点,减少数据处理的需要。Stability AI 正在利用专门用于 SDXL 的 T2I / ControlNet 构建下一代任务特定结构、样式和组成控制。这些功能目前处于测试预览阶段,可以随时关注微调的更新。SDXL 1.0 上的图像控制也即将推出。
自 4 月 13 日发布 SDXL beta 版本以来,ClipDrop 用户已经使用该模型生成超过 3500 万张图片,而 Stability AI 的 Discord 社区平均每天生成 2 万张图片。
看看用户使用 SDXL 1.0 的效果吧。
推特:@pratzlowcode
从网友的图片生成效果来看,SDXL 1.0 在光线上把握更加精准,光线效果、色彩对比更加真实。
推特:@foxtrotfrog
可以看到,在色彩的运用上,SDXL 1.0 更加大胆,饱和度较高的情况下光线与阴影的细节依然在线。
推特:@ai_for_success
在这张图片中可以看到,景深较为合适,主体突出,色彩之间的过渡,甚至真实度都十分优秀。
推特:@sizubito
网友制作了 SDXL 0.9 与 SDXL 1.0 的对比图,左边为 SDXL 0.9 生成图像,右边为 SDXL 1.0 生成图像。可以明显看出二者对于色彩运用的差距。SDXL 1.0 的色彩更加丰富且真实,光效表现也更加出色。
也有网友在 SDXL 1.0 中使用 Midjourney 中的旧 prompt,评论中纷纷感叹,它的效果不比 Midjourney 差,甚至有些出乎意料的优秀。
SDXL 1.0 细节:Base 和 Refiner 模型
Stability AI 将 SDXL 1.0 与各种模型进行了对比测试:与 Stable Diffusion1.5/2.1、SDXL 0.9 等模型相比,人们更喜欢由 SDXL 1.0 生成的图像。
SDXL 1.0 也是所有开放式图像模型中参数量最多的模型之一,它建立在一个创新的新架构上,由一个 35 亿参数的基础模型和一个 66 亿参数的细化模型组成。
完整模型包括一个用于潜在扩散的专家混合管道:第一步,基础模型生成(噪声)潜在变量,然后用专门用于最终去噪步骤的细化模型对其进行进一步处理。
基础模型也可以作为独立模块使用。细化模型为基础模型的输出添加更精确的颜色、更高的对比度和更精细的细节。
这种两阶段架构可确保图像生成的稳健性,而且不会影响速度或需要过多的计算资源。SDXL 1.0 可在配备 8GB VRAM 的消费级 GPU 或随时可用的云实例上有效运行。
© THE END
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!