《AI绘画领域的领跑者:Midjourney的崛起与创新》
文章主题:AIGC, Midjourney, 人工智能, 图像识别
本文来自微信公众号:全天候科技 (ID:iawtmt),作者:于惠如,编辑:罗丽娟,原文标题:《“少数人”的胜利,Midjourney走上AIGC神坛》,头图:由Midjourney生成
如今,不知道Midjourney这家公司,似乎就不配谈AIGC。
最近,AI绘图工具Midjourney推出了第五代V5模型,并生成了一张“中国情侣”的图片,因其酷似的真实感而引起了广泛关注和讨论。紧接着,该工具又宣布将推出专门针对二次元和动漫风格的版本,以满足广大用户的需求。
图片:由Midjourney生成
新版Midjourney的推出,使得用户可以轻松运用风格化命令,创作出专业级别的作品。为了持续改进使用体验,我们采取高频迭代的策略,不断优化功能和服务。一段时间以来,关于Midjourney的极简入门方法、使用技巧、高级玩法以及如何实现变现等方面的攻略,在网络上广泛传播,受到了众多用户的关注和喜爱。
近期,随着众多新用户的加入,加上GPU供应的暂时短缺,使得Midjourney付费用户服务遭遇严重困扰。因此,该公司不得不暂停免费试用活动。
在业界,Midjourney因其卓越的产品效果而备受赞誉。这家由David Holz于2021年8月创立的公司,尽管只有11名全职员工,且一直未接受过融资,但凭借其独特的付费订阅商业模式,成功实现了年营收1亿美元的业绩,成为文生图领域的领军企业。
资料来源:The information 官网
一家只有11名员工的小公司,没有获得任何外部投资,却在AI绘画领域崭露头角,成为行业的佼佼者,甚至让其他同类公司相形见绌。
如今,Midjourney在聊天软件Discord平台上已吸引近1500万用户,其在我国人工智能绘画领域的地位日益稳固,成为该领域无法忽视的一家重要企业。
一、创始人曾两次拒绝苹果
在这个纷繁复杂的世界里,我们并非致力于销售任何商品,亦不需要身份地位的光环,只为了在未来十年的时光里,能有一个温馨的家,一个充满意义的舞台,去追求那些令人热血沸腾的梦想。我们的期望并不仅仅局限于我自己,更希望对整个世界产生积极的影响,让每一个瞬间都充满欢乐与满足。这就是我们一直以来的信仰,也是我们不断前行的动力。一年半前,Midjourney的创始人David Holz曾在接受媒体采访时,如此坚定地表达过他的想法。
David Holz的愿景是创建一个”想象力引擎”,他坚信想象力是人类获取事物的重要推动力。同时,他主张将人工智能技术(AIGC)转化为提升人类想象力的力量。
图源:Midjourney官网
Midjourney官网上,关于David Holz的此前经历的介绍非常简洁:Leap Motion创始人;NASA和Max Planck研究员。
图源:Midjourney官网
“这很Midjourney。”一位AIGC领域创业者说,它的风格就是简单、直接、高效,就像他们做产品的思路一样:“所有精力集中在模型上,不做app,也不做网站。”
高中时期的David Holz感兴趣的是设计,也做过设计生意。上大学后,他学了与设计几乎不相干的物理和数学。研究生期间,他希望能选择与现实有关的专业,于是读了应用数学专业。之后,他又攻读了流体力学博士。
创业的想法很偶然。“有一次我不知所措,把所有的事情放在一边。所以我搬到了旧金山,创办了Leap Motion。”David Holz曾在接受媒体采访时说。
Leap Motion成立于2010年,彼时VR、AR行业还未开始火热。两年后,极具极客气质的Leap Motion控制器诞生。这个看起来像U盘一般大小的盒子尽管看似毫不起眼,但一经展示便立即吸引了大量的关注。
这个控制器内装有多种传感设备,能追踪到小到0.01毫米的动作,当你把手放在它正上方,便可以跟踪十指动作,并借助计算机视觉技术,让你的手部动作投射在虚拟空间中。
这款充满着想象和憧憬的产品推出后,Leap Motion一炮而红。2013年经过B轮融资之后达到巅峰状态,估值达到3.06亿美元。
彼时,苹果的AR项目还在初期,希望通过收购将优秀的团队和项目整合到自己的项目中。然而理念的差异让苹果吃了闭门羹。这是David Holz第一次拒绝苹果。
五年后的2018年,Leap Motion已没有昔日的名气,但技术实力依然不弱。接到苹果再次邀约之后,双方开始了谈判,但在交易进展到尾声阶段时,收购再一次叫停。
在之后的公开报道中,David Holz间接解释了拒绝苹果的原因,他认为苹果已经失去了创造力,甚至直言:“我永远不会为那些家伙工作,他们是魔鬼。”
最终在2019年,David Holz以3000万美元将Leap Motion卖给了竞争对手UltraHaptics。
Midjourney是David Holz在AI艺术领域探索新机会的产物。
后面的这次创业,David Holz没有融资,但靠“刷脸”解决了Midjourney算力问题。
据报道,David Holz给一个云供应商的负责人发邮件,希望对方提供10000个GPU。很快,Midjourney获得了云供应商的支持,原因便是他们了解到David Holz,知道他以前的创业经历。
二、低使用门槛抢占用户心智
“相比其他同类产品,Midjourney的Prompt简短,用户门槛低。”一家第三方研究机构在其报告中写到。
Midjourney使用起来极为简单,注册Discord账号之后,即可进入Midjourney频道,随后可以加入公测服务器。使用时,用户只需要输入命令提示符,就可以生成对应的高品质图形。它可以让用户避开复杂的使用技巧,同时可以用算法让机器想象你输入命令的样子。
这也是Midjourney能够脱颖而出的地方。凭借简单的Prompt,Midjourney借助Discord社区持续迭代,社区用户将近1500万。
图源:Discord
一位Midjourney使用者告诉全天候科技,Midjourney给人的感觉是用起来简单而且无约束,“有一种不可思议的力量和流动,就像一款能让我上瘾的游戏。”
而在前述AIGC领域从业者看来,Midjourney拥有游戏的所有元素:能够让你想象任何实物的可靠核心圈层,魔咒一般灵巧的指令符,以及基于社区的开放文化。
Midjourney生成的人物图 图源:推特账号Nick St. Pierre
为何不直接做一个iOS拍照应用?而是选择Discord用户界面。最初其实是因为Midjourney团队是一个远程工作的团队,所以建立了一个机器人。
后来,团队用同样的机器人在 Discord 上做了一个用户测试,得到的结果是:用户很喜欢这个实时交流想法,富有想象力的环境。这也让David Holz看到了Discord体验的神奇之处。
“我们发现人们真的喜欢一起想象,所以我们让Midjourney更具社交性。我们有一个巨大的Discord社区,用户在这些共享空间中共同想象。”David Holz曾在公开采访中表示。
他认为,人们想要一起做事情,如果是在iOS平台去做,就必须做自己的社交网络,这非常困难。但相反,如果用户想要自己的社交体验,Discord是很好的选择。
作为一款适用于游戏玩家一体化语音和文字聊天软件,Discord平台的社交属性也让Midjourney抢占了更多的用户心智。“它在Discord上更像是一个艺术AI的社交空间,能够让它易于迭代、学习、发现和发展。”上述AIGC领域从业者说。
Midjourney生成的“卡塔尔世界杯”画面。图源:小红书博主Ai船长
换言之,Discord社区生态帮助了Midjourney的推广。反过来,庞大的用户能够根据自身需求针对性地训练模型并快速迭代产品。
作为AI绘画领域的两个“领头羊”,人们总会把Midjourney和Stable Diffusion放在一起对比。
对比而言,Stable Diffusio是一个免费开源的模型,完全免费、不限次数、任何人都可用的。因而,Stable Diffusion的优势在于其无需任何成本即可使用。
同时还可以在GitHub上找到完整的源代码和文档。另外,开源前提下,模型代码迭代的速度也增快,优化效率高于闭源模型。
但缺点也显而易见:如果没有其他护城河,商业化问题难以解决,很容易成为别人前进的垫脚石。
而Midjourney则需要付费使用。和大部分软件类应用类似,Midjourney采用付费订阅的模式,按月向用户收取费用,共有3种收费套餐:10美元/月、30美元/月、60美元/月。
图源:Midjourney官网
相较而言,收费模式容易劝退用户,在社区支持和维护方面也逊于开源的Stable Diffusion。
然而,相对封闭也成为Midjourney构建自身护城河的重要方式。因为没有公开其源代码,因此无法被广泛地研究、改进和应用,Midjourney积累的数据集具有独家性,可以进行针对性训练。
Midjourney的成功或许包含了多种因素,比如:清晰的目标定位,快速在一个仍然混沌的市场中找到合适的产品形态;专注在有价值的具体业务方面,迅速形成技术优势;找到一个有充沛流量的场景Discord,实现低成本获客,低成本营销等。
想象力的空间已经打开,AIGC的竞争越加激烈,Midjourney 还能赢在未来吗?
本文来自微信公众号:全天候科技 (ID:iawtmt),作者:于惠如,编辑:罗丽娟
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
End
为何关注半导体?半导体下跌两年,股价处于低位;复盘上一波半导体行情,一季报后实现爆发;市场预计23下半年半导体周期反转,提前布局!本课带你全面梳理一季报,读懂先行指标,抓住个股α机会!
AIGC, Midjourney, 人工智能, 图像识别
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!