产品经理&设计:hali,腾讯 IEG光子工作室技术大佬:usagi & willbean提示词工程:usagi & hali本文由hali以主观视角撰写
PART1. 由来
不知道大家使用Midjourney(以下简称MJ)的经历是怎么样的,而我遇到的很大的困扰是,脑海里有一个想象,但是其实不知道怎么表达才是合适的。
网上的工具有挺多,比如OPS、冰枫营AI提词器,也看过很多教程和文档,但是会发现有个问题:就算我有了这些工具和教程,我依旧很难在那么多提示词里面挑到一个满意的答案,只能不断不断的测试和试错。
既然已经是AI时代了,为什么在写提示词的时候却不能更聪明一点,而还需要我不断重复操作,不断胡乱的删添繁简,以期望在上百张图里面能撞到大运出来一张令人满意的结果呢?
有一天在用MJ给我干活的时候,突然想到,如果能用GPT给我更多的推荐会是怎么样的?
根据这个想法,就打造了这个AI提示词工具,希望可以帮助到大家更好的使用AI绘画工具!
PART2. 工具
这是一个基于GPT与提示词工程打造的AI绘画提示词推荐工具。
这款工具能力很简单,就是输入你任何想展开想象的内容,我们会通过大语言模型的能力,将你的想象按照不同维度拓展。
它唯一的使命就是:
让想象更多想象
请注意:这个工具不是为了取代你,一键生成完美的提示词,而是帮助你,让你获得更多的想象和描述角度。
体验网址:
https://midjourney.talkgame.ai/
建议使用电脑打开网址,手机版本体验还不是很好,产出的词条还不能完全保证精准度和可用度,可能会有一些页面的BUG和服务器爆炸的问题,如果炸了请第一时间联系我,一起共建~
也因为做了大量的提示词工程,在消耗token上是比较惊人的数量,GPT3.5的API使用费用实在有点招架不住,但我想做的就是让AI普惠,用AI发电,因此也希望大家可以免费白嫖使用到,在每日使用次数上会有限制,每天常规用户只能使用3次,但只需要在交流群里每天获取最新的口令,将获得每3小时15次的使用额度,让大家可以更好使用上这个工具。(交流群的加入请在工具页面上获取)
PART3. 功能
这个工具功能非常简单,就是通过它可以给你更多的灵感和创意,以帮助你去更好的使用MJ。
1.主体细化描述
这个工具会对你给的内容进行分析,发现这个内容的主体,并对这个主体进行详细描述。
例:输入【皮卡丘】,会帮助你快速描述皮卡丘这个主体。
2.风格与艺术联想
这个工具会根据你给的内容,进行风格联想,给你更多的有关风格、艺术家或相关作品的想象,让你在使用MJ的时候可以有更稳定的控制。
例:输入【水下摄影】,它会给你提供全球知名水下摄影艺术家。
3.色彩视角灯光的推荐
这个工具还会对现阶段描述的画面,提供更多的有关画面构成的推荐。
例:输入【玛丽莲梦露】,它会给你提供构图视角和灯光的建议。
4.推荐理由
这个工具也通过大语言模型的能力,将给你解释它推荐这个词条的原因,并判断跟你输入的词相关的匹配度,帮助你判断使用。
例:输入【玛丽莲梦露】,它会给你提供相应的推荐理由。
5.一键复制所有词条
点击tab会将词条储存于底部的临时收藏栏,一键即可复制所有词条,帮助你直接复制到MJ上使用!
以上就是所有功能,未来还会拓展直接自动按照你的选择再生成完整提示词的功能,并会增加更多的参数推荐。
PART4. 实际应用演示
如果我要用MJ画一个龙珠里的孙悟空,我其实不太知道他叫啥英文名,没关系,咱就是说,直接问:
Input:龙珠里的孙悟空叫什么名字
Output:Son Goku
然后开始丰富主体细节,选择合适的词条复制:
Input:龙珠里的孙悟空
Output:Anime, Dragon Balls, Super Saiyan
看看有没有啥更有冲击力的镜头
Input:很近的镜头
Output:Extreme closeup view
再把颜色搞得更夸张一点
Input:色彩超级无敌鲜艳
Output:vibrant colors, Color Field Painting
搞点之前用MJ很好用的玄学词汇:
Input:生物发光色彩
Output:bioluminescent colors
搞点更鲜艳的色彩和背景:
Input:荧光色背景
Output:vibrant neon background, Psychedelic
最后将这些词条组合一下,并增加一些MJ的参数设定:
Anime, Dragon Balls, Son Goku:: 1.5, Super Saiyan, Contrasting Composition, Extreme closeup view, dramatic lighting, vibrant colors, Color Field Painting, bioluminescent colors, vibrant neon background, Psychedelic –ar3:4 –q 2 –s400 –niji 5
这样就完成了这个极具视觉冲击力的超级赛亚人了~
PART5. 产品实现流程
下面我给大家描述一下实现这个工具的整个流程,作为一个不懂代码的设计师,我是如何完成这个网页产品的?
这完全仰仗GPT4给带来的无限可能!
具体开发流程是:
1.产品策划:在ChatGPT上建立MVP提示词工程,试验可行性
2.产品设计:使用Figma做UI和交互
3.产品开发:通过GPT4从0到0.5开发MVP产品
4.跪下请求技术大佬的帮助:这是整个产品开发最重要的步骤
5.提示词工程:不断打磨和优化提示词工程
6.产品上线:也就是现在你们看到的工具的样子
我将一步步给各位展开整个具体的开发流程。
1.产品策划
在第一个阶段,就是试验这个想法的可行性,整体的产品搭建思路就是想通过GPT,我提供一个基础的【输入】,它会把我的输入展开【想象】,并且给我更多的如【风格、艺术家、电影等等】这些我不太能想到的一些词条,然后把它贴回到MJ去生成。
以此为想法我做了第一次个尝试,就是直接用自然语言去测试可行性:
Test1:
第一次他给的答案看起来好像还不错,但是有个问题,这些人经过我丢进MJ上去生成,有好几个艺术家并不能产生效果,很明显GPT推荐的这些艺术家可能并没有被训练到。
Test2:
没想到刚开始就滑铁卢了,我又开始琢磨,是不是GPT推荐的艺术家们在网上的作品数据不够多,又或者是GPT瞎编的呢?于是我又做了一个尝试。
这次的效果比我想象中的好了很多,这里已经大部分的艺术家风格都比较清晰且准确,在mj上也能得到不错的反馈。
Test more:
然后开始用这样的方式,开始不断的测试,尽可能测试到一个更为稳定表述方式。
JSON:
经历一系列的初步调试,开始写出第一个MVP版本的提示词工程,这里使用了吴恩达的提示词工程课程里讲的写提示词的重点方法:编写明确和具体的指令,留给模型足够的思考时间。
因此我让GPT分步骤思考内容,并让他解释推荐的理由,再让它以JSON格式输出,JSON格式将为后续转化到api接口输出时提供巨大的帮助。
结果看起来很不错,不是吗?
2.产品设计
有了这个MVP模型,下一步就是开始搭建整个产品设计框架了。
在整体的界面规划上,其实很大程度借鉴(chaoxi)了一下ChatGPT IOS版本的UI设计。
从GUI到LUI,界面开始往自然语言交互方向演变。
因此界面设计应该足够简洁,并且交互要非常简单直接,要完完全全降低用户的学习和使用成本。
因此在这个产品设计上,就仅仅是从一个输入框开始,出现的词条也是非常清晰地排布在界面上,通过颜色去区分不同的模块。
并且在交互上做了很多小心思,比如悬停出现对该词条的推荐理由,点击就直接将英文词条复制到剪切板。
3.产品开发
有了UI和交互,现在万事俱备只差程序员了。
但是作为内向腼腆社恐的我,得去哪里找程序员大佬来给我干活呢?
于是,为传承中华民族自力更生自强不息的优良传统,我开始–打开B站,开始了第一步:
然后选择了放弃。
我连学啥都不清楚。
我又开始打起了小心思。
大家不是都说GPT4很牛吗,那是不是可以用它真正的写一个能用的代码出来?
光说不练假把式,咱就是说不撞撞南墙又怎么能知道自己头铁不铁呢?
于是开始了学习如何【自然语言编程】:
从B站的一些大佬的视频中学到了一些方法。
Step1:
先找GPT4了解一下如果要做一个网页需要做多少事情。
Step2:
找个最小可行性实验,写一个能输入并且输出的网页。
好的这个肯定没问题,都用不着测试了,毕竟别人可是用GPT直接写pygame的。
Step3:
从这样的框架开始逐步展开,记住使用GPT的核心方法:编写明确和具体的指令,留给模型足够的思考时间。
将GPT给的所有代码复制到TXT文档里,并且修改相应的后缀,就能得到能打开的前端了!
Step4:
然后你就会遇到问题,无法执行啊这是咋回事,直接把错误代码复制回给GPT,看不懂继续追问,原来apikey不能直接粘贴在前端,需要将apikey放在服务器。
这对我来说也太难了吧!!我根本不知道怎么弄啊!
Step5:
GPT告诉我,需要开始用python写一个简易的后端,并且要配置各种奇怪的环境….
到这一步我就实在给我整不会了,我只会把代码贴进TXT文件改后缀这样的操作,要我搭建环境,而且就算有GPT的指导也并不太能搞定,太复杂了真看不懂了 T.T
(此处我的GPT记录丢失了实在找不到了)
总之这个过程非常为难我,要打开什么终端安装python3,还要下载什么pip,听都听不懂的各种东西
4.跪求大佬
终于到了最关键的一步了,实在是搞不懂这一块的我,厚着脸皮请求技术大佬的帮助。
他帮助我搭建了环境,开始迅速提效,技术大佬指导加上GPT4,开发进度史无前例地飞快运转。
在某个周末凌晨4点,这个产品的MVP模型已经完全实现!!
当时的快乐,我无法给大家用语言描述!!!
之后就是开始优化整个画面,实现我的UI界面了!
我也深刻意识到,不是很懂代码现阶段而言还是没办法通过GPT完美地实现,还是需要程序员的帮助。
之后的代码包装美化和接入网络服务器,就交给技术大佬了。
在几个小时的时间里咔咔一顿撸,就此完成了这个整个MVP页面的开发。
果然,术业还是需要专攻的。
5.提示词工程开发
既然把整个MVP页面搞定了,就开始要琢磨,有没有可能把这个产品变得更加有用,结合之前使用MJ的经验,增加更多的功能属性。
我将功能再次拆解细化:
1. 主体细化描述
让GPT思考分析用户输入的内容的主体,并且加以细化描述:
2. 风格与艺术联想
让GPT根据整体用户输入的内容,进行风格和艺术的联想:
3. 构图视角灯光的推荐
通过给予GPT足够的相关MJ数据,让GPT根据用户的输入,进行构图视角灯光的推荐:
6. 产品上线
在某个凌晨,终于把产品整上线了!自己一番体验,丝滑至极,兴奋得双脚离地,差点楼下邻居都要上来打我了!!
PART6. 后记
以上就是整个实现产品的流程,现阶段的产品还是会有很多不完美的地方,但通过这样的一次经历,也让我真正意义上的第一次参与进了这场由AI带来的变革,也是第一次真正地从零到一开发一个小小的AI产品。
甚至自己体验自己开发的工具一番之后,更真切地感受到了AI带来的真正意义上的降本增效,我甚至无法想象再过多几年会发生什么?是不是数字生命真的出现,真正的AGI很快就会到来呢?
对于AI降临派而言,这一切的一切,真的,太酷了!
# 腾讯技术直播 #腾讯工程师分享技术干货:
扫码预约,get开播提醒往期文章:GPT4开放API和Code Interpreter!如何利用它们来提升你的工作效率测评 PS 最新 AI 功能 在美宣上的使用基于ChatGPT+Stable Diffusion实现AI绘画基于GPT设计数据产品的一些思考点个关注,下期再见👋