韩国主播
畴昔一年,AI文生图模子捏续进化,不仅能熟识独霸各路画风,而且赓续处罚画不好手、搞不解白空间位置、不睬解“红烧狮子头”等有歧义或抽象意见的各种难点。
海外Midjourney、DALL·E 3、Imagen 2虽好,但用起来有一定门槛。好在国内大模子企业们急追猛赶,发布了一大波恰当中国东说念主体质的AI绘图器具,在易得性上甩开海外AI器具十条街。
这些器具通通可以免费体验,通过网页或App即可使用,在使用门槛上基本拉不开差距。拼生成速率吧,纯粹每张图片齐能在半分钟内生成,具体受收集环境或浏览器情景的影响,作念不到很客不雅。
那么谁才是国产AI文生图器具的头号玩家?谁才是辅助专科创作家进步遵守、挽回绘画小白于火热水深的神器?回答这个问题,要历练两个要道材干:意会到位,画得精细。
为此,我对国内10款免费的AI文生图器具进行了5个梯度进阶的体验对比,考题包括但不限于平方脑洞、收集名梗、头像绸缪、公司年会、春节氛围、跨界组合、诗词意会、多轮修改,来望望哪款器具更轻车熟路、更能秒懂用户的心。
空洞来看,智谱AI的智谱清言是举座阐述最贯通的一款AI文生图器具,在10个训练中基本齐能生成恰当我条目的图像。
不外全员翻车的考题也不少,举例画出来的鹦鹉爪子不仅稀奇古怪,数目也与真的不符;意会不了时下正热的“南边小土豆”,还把“拿着冰糖葫芦”这一动作画成了串在一说念的土豆;把福字、对子上的笔墨写的像鬼画符……
论笔墨意会材干,智谱清言、文心一言、讯飞星火、通义万相、混元助手的阐述更胜一筹。360智绘、好意思图MiracleVision则在濒临第一说念题的“阿拉斯加”时就出了岔子,烦躁把阿拉斯加画成一个男东说念主/北极熊。
论画面精细进度,智谱清言、通义万相、文心一格生成的春节氛围图险些可以拿来即用;但画出来的祥瑞物,即使径直点名龙年布景,终端通义万相、讯飞星火、抖音豆包的祥瑞物形象可以说与传统“龙”没联系系。
论多轮修改的靠谱进度,文心一言是每一轮齐坚捏到终末的玩家,智谱清言齐是忠于上一幅图片修改,腾讯混元助手的阐述则可圈可点,有的每一步需求齐意会到位,有的却加了一些奇怪元素。举座来看,多轮修改是绘图、绸缪的必备妙技,但基本统共的AI绘画器具齐无法作念到。
为了保证对比的平正,我在体验每一个器具的生成材干时均以第一次生成图片为准,具体的对比如下:
01.
青铜难度:1-2个要道词,鸟爪、收集热词难拆解,讯飞、智谱AI阐述亮眼
第一阶段青铜难度的教唆词较为概略,这些教唆里包含的要道词大多唯有2个,包含生成图片中的主要变装,以过火这一变装的地舆位置、活动动作、图片大小、图片立场等其中之一个要道成分。
最初是“一只站在楼顶的阿拉斯加”,主要包含对地舆位置和阿拉斯加犬种的意会。
将两个要道词分拆来看,各个器具齐通过周围楼层的对比或者俯视来呈现“站在楼顶”。大巨额图片也齐特出了阿拉斯加大型犬、是曲配色、长毛等主要特征。
但是令我没预见的是“阿拉斯加”这个常见犬种,果然会有AI生成的形象完全与之不搭边。好意思图MiracleVision画了一只形似北极熊的动物站在了楼顶,360智绘更离谱,画了一个男东说念主站在楼顶。
第二说念题是生成“一只站在树杈上的粉色鹦鹉”,这一教唆词的要道词主要包含地舆位置、粉色、鹦鹉。这说念题的难点在于鸟爪和东说念主手一样,齐是困扰AI的一说念难关,一些AI生成的鸟爪图平凡会出现形态误解、奇怪的情况。
神机妙算,10款AI绘画器具十足翻车。鹦鹉脚趾为对趾型足,两趾上前,两趾向后。但这些图片中有的将脚趾遮掩在树干之后,有的即使画出了脚趾但数目和位置也分歧。
不外这些AI生图齐呈现了“站在树杈上、粉色”的特质,也齐能一眼看出是鹦鹉,但经不起细看。
当我放大图片细细不雅察时,通义万相、讯飞星火、讯飞星火绘画助手、好意思图MiracleVision在鹦鹉眼睛的处理上也出了岔子,有的鹦鹉一侧有两只眼睛、有的眼球很小完全失真。
第三说念困难是“一个拿着冰糖葫芦的南边小土豆,‘南边小土豆’是东北东说念主对搭客的昵称”,这一教唆词的主要难点在于意会“拿着冰糖葫芦”和“南边小土豆是搭客”。
从终端来看,有的图片将土豆当成山楂串了起来,有的径直将一颗颗小土豆再行摆设组合,还有的径直搬来了土豆的卡通形象。
其中独树一帜确当属讯飞的两款AI器具,充分意会了“小土豆是搭客”这一意见,我也终于在10张图片中看到了真东说念主形象。
但冰糖葫芦全部翻车亦然我没预见的,唯有智谱清言的卡通形象在一根木棍上串着几颗红色果子,还略微与冰糖葫芦贴边。
青铜挑战的终末一说念题是,“用青花瓷立场画冷杉”,对图片立场进行了指定。
这一浩劫题的生成终端之间的差距较大,有将冷杉画到青花瓷器具上、有将青花瓷斑纹画到冷杉上、还有使用青花瓷对应的线条相貌等径直呈现一幅画。
前两种诚然将青花瓷立场和冷杉这两大元素相伙同,但意会的仍然不够准确。其中通义万相、智谱清言、腾讯混元助手的图片嗅觉致使可以径直拿来用,其将青花瓷立场径直融入到了画中。
不外,智谱清言的画还有一个小bug:将冷杉画成了松树。
02.
白银难度:要道词数目翻倍
汉字、指定位置推行翻车多
艾秋麻豆剧果冻传媒在线播放白银阶段的教唆词难度上涨,要道词从2个增长到5个以上,况兼需要对要道词描写加以意会。
第一说念题为了契合行将到来的春节,让AI绘画器具生成了“一张春节氛围油腻的图片,需要包含灯笼、对子、福字”,除了好意思图MiracleVision外,其余图片齐体现了干预的春节氛围。
为了缩小少量难度韩国主播,肤浅我能快速在图片中找到相应元素,自拍街拍这说念题只缔造了“灯笼、对子、福字”三个明确的要道词,但终末的终端并不齐备。
智谱清言、抖音豆包倒是完全保留了三个元素,但中笔墨符的呈现仍然是一浩劫题。智谱清言的图片可以对付看出“福”的轮廓,抖音豆包的对子、福字则全是一堆乱码。
其余几个器具生成的图片中大多齐只包含其中的1-2个元素,而通义万相、讯飞星火、讯飞星火绘画助手、腾讯混元助手的春节氛围特别浓厚,通盘画面看起来也很协调。
第二说念题的要道词数目径直翻倍,包括“饺子,好意思食,繁荣昌盛,色调柔柔,高弥散度,食品照相,诱东说念主,定焦,超清”。
启航点我认为这说念困难的门槛会在背面一长串的领域词呈现上,但没预见径直从“饺子”就运行翻车。抖音豆包、讯飞星火、讯飞星火绘画助手、通义万相、智谱清言生成的图片能看出是正统饺子,其余几个还是径直“变异”为包子。
第三说念题中缔造了一个难关,“一家公司开年会,在图片的右上角位置,需要有年会主题的横幅”,需要在指定位置画出年会的横幅。
在体现氛围这一块,这些AI器具画得齐还可以。不外,360智绘、通义万相、好意思图MiracleVision的图片并没特意会“年会”的意见,而是径直不详了“年”字,生出了一张巨匠开会的图片。
这说念题里我并莫得将放横幅的位置指定特别精确,只是混沌说了“右上角”。从位置来看,抖音豆包、讯飞星火、讯飞星火绘画助手有横幅、主题,但齐在画面的正上方,智谱清言的图片右上角可以彰着看到有横幅、口号类元素。
白银阶段的终末一说念困难是,“本年是龙年,为春晚画一幅宣传海报,需要有祥瑞物”。
春晚的祥瑞物传统由来已久,龙亦然中国传统文化的典型代表形象,AI绘画在这两个元素的伙同方面如实给出了一些更新的想路。有龙头东说念主身、小恐龙形象等等,还有一些致使完全脱离了传统道理的龙。
从终末的生图后果来看,除了智谱清言的图片有出现宣传海报的边框等,其余大多齐唯有一个祥瑞物形象和布景。
03.
黄金难度:联想力发散测试
“鱼升龙门”险些难倒统共器具
黄金难度训练的既是AI绘画器具的联想力与创造力,还有对一些误导性教唆词的分歧。
第一说念题为“两个机器东说念主联袂登月的四格漫画”,四格漫画想要考研AI绘画器具能不可将四个有彼此关联的画面呈现出来。
从终端来看,诚然单看图片无法意会四格漫画呈现的具体故事,但相似的变装以及变装动作、布景的篡改齐呈现出了其中的连贯性,其中的代表AI绘画器具便是智谱清言、抖音豆包、好意思图MiracleVision。360智绘生成的图片诚然也呈现了四格漫画,但更像是一个东说念主类登月的故事。
其余几款器具则径直忽略了“四格漫画”这一要道词,只体现了“两个机器东说念主联袂”登月。
第二说念题愈加无厘头,“蒙娜丽莎来到中国应聘为别称圭表员”,需要AI绘画器具体现出蒙娜丽莎、中国、圭表员三个元素。
文心一格、讯飞星火、讯飞星火绘画助手径直将蒙娜丽莎的经典形象和电脑相伙同,百度文心一言、360智绘、阿里云通义万相、智谱清言、混元助手则进行了完全再创作,前三个生成的图片可能是为了贴合中国这一元素,长相更像中国东说念主。智谱清言的形象更贴近异邦东说念主形象,况兼独一将“应聘”体现出来的图片,混元助手则自行礼聘了漫画画风。
抖音豆包、好意思图MiracleVision径直将蒙娜丽莎的原形象搬到了图片上,但退换了图片布景,不外并不可让我一眼看显着想体现的要道元素是什么。
第三说念题为AI绘画器具挖了一个大坑,“一只叫作念‘松鼠鳜鱼’的鱼奏凯跃龙门”,需要AI遁藏“松鼠鳜鱼”,精确get到这不是重心。
“松鼠鳜鱼”这一困难照旧骗过了1/2的AI器具,好在此前的“松鼠跪在一条鱼前”的乌龙莫得再次出现。讯飞星火的图片体现的是“鱼跃门”,智谱清言包含了“龙”和“门”。好意思图MiracleVision更为概略荼毒,径直用笔墨将这条鱼的名字打在了正中间。
04.
铂金难度:字面直译绘图
古诗田地呈现相距较远
终末钻石难度,便是逼近国古东说念主聪惠之大成的古诗意会步地。一般而言,古诗寥寥数语背后蕴含了与社会布景、东说念主物古诗等齐相关的田地等,是以既需要AI意会这句诗,还应该集结古诗高下文。
为了按序渐进,AI绘画器具一运行接受到的诗句齐是画面感很强,有特出的对象和环境描写。
第一说念题是“墙角数枝梅,凌寒独自开”,单看句面意思意思拆解来看便是墙角、梅花、阴凉、灵通这几个要道词。
除了匠心独具的好意思图MiracleVision,其余几款器具齐将“梅花”、“开”行为画面的主体。文心一言的画作边上还有诗句及钤记,更恰当古诗配图的立场。文心一格、通义万相、智谱清言、讯飞星火、讯飞星火绘画助手、腾讯混元助手的画面上齐有雪花,体现了“凌寒”。
智谱清言的梅花处于墙角,但从外不雅看更像当代的墙壁,与古诗暗含的年代不相符。
第二说念题的古诗“黄河之水天上来,奔流到海不复回”画面感也很强,但与梅花不同,这句诗中的“黄河”有指定的对象。
好意思图MiracleVision仍然径直了当将诗句放到了图片正中间。抖音豆包、百度文心一言、百度文心一格、阿里云通义万相的图片关于黄河的呈现更为真的,且体现出了“奔流到海”的威望。智谱清言、讯飞星火、讯飞星火绘画助手更专注于呈现“黄”的元素。
360智绘诚然能感受到黄河,但河面过于坦然,莫得奔流的威望。
终末一说念题“了却君主寰球事,赢得生前死后名”的难度在于,画面感不彊,AI无法径直从字面赢得到诗句的主要对象。
从AI绘画器具生成的图片可以看出,大多器具将“君主”行为图片的主体,通义万相是一个大型宫殿,也从侧面体现的是君主。不外文心一言和文心一格呈现出的是一个女性形象,与古诗的字面意思意思看起来毫无策动。
好意思图MiracleVision无法笔据这一教唆词生成图片。
当将“醉里挑灯看剑,梦回吹角连营。八百里分麾下炙,五十弦翻塞外声,沙场秋点兵。马作的卢马上,弓如轰隆弦惊。了却君主寰球事,赢得生前死后名。轸恤白首生!”整首诗行为教唆词,AI绘画器具生成图片更恰当古诗自己的田地,齐有建立沙场的将军形象。不外好意思图MiracleVision仍然无法生成。
其中,智谱清言左下方还有诗句,更恰当古诗配图立场。360智绘、阿里云通义万相图片中唯有一位将军形象,无法体现出更重大的局面。
05.
钻石难度:多轮对话反复修图
仅文心一言坚捏到底
每一个绸缪师的绸缪稿齐有N个版块,是以想要让AI画出我兴隆的图片就需要反复提需求。
然则在这一步地只剩三位竞争敌手:文心一言、智谱清言、腾讯混元助手。其余几款器具因为不扶植多轮对话等原因径直退赛。
第一说念题照旧延续了上文多个AI器具败下阵来的春节氛围图的教唆词。
这回我变难缠了,对AI器具生成的图片愈加抉剔,在让它们生成一张春节氛围浓厚、包含灯笼、对子、福字的图片后,又不断建议新的修改条目,包括“画面更写实”、“东说念主多少量”、“画面里还要有东说念主在放鞭炮”等。向统共AI器具齐输入的笔墨齐完全一致。
文心一言生成的四张图中,除了对“写实”这个词意会不到位,其余改良齐很恰当我的需求,况兼可以看出下一幅图基本莫得偏离上一幅的整身形度。
与文心一言比较,智谱清言的四张图能彰着感受到是归拢幅画面的推行缓缓增多,不外亦然在“写实”这部分,后三张图仍然为卡通、动漫立场。
腾讯混元助手的四张图可以用立场迥异来描写了,每一张齐是在前边统共需求的基础上进行再创造,不外关于“写实”的意会,混元助手也更胜一筹,后三张彰着嗅觉更为真的。然则,终末一张图,混元助手却将“放鞭炮”画成了“放烟花”,完全找不出鞭炮在哪儿。
第二说念题亦然前边重大AI绘画器具也曾化饺子为包子的考题条目加多版。
在让每个AI器具画一张刚出炉的饺子相片后,我又赓续建议“让这盘饺子冒着热气”、“再多来几盘饺子”、“驾驭再多几盘菜”、“驾驭再坐一家东说念主吃这些菜”等修改条目。
一共五轮对话,一齐坚捏到终末的唯有文心一言,智谱清言在加几盘菜步地落败,告诉我它还莫得构想好,可以换其他需求,混元助手只是坚捏到了让饺子冒着热气,就呈报“还未学习到如何回答这个问题的推行”。
不外,乍看之下文心一言的前四张图险些莫得隔离,第四张图诚然对付可以看到饺子周围多了几个碗,但这些更像是蘸料碗。终末一张的氛围倒是很对,但并莫得在此前的版块上修改,等于十足推翻重来。
智谱清言诚然仅有三张图,但齐按条目改了,不外照旧和之前的问题一样,终末饺子变包子。智谱清言生成的每一张图底下还附带了它对图片的意会与阐明,比如第三张图它有提到“中心是一盘冒着热气的刚出炉的饺子,周围摆放着几盘其他多样不同的中国菜肴。这些菜肴包括蔬菜、肉类和米饭,代表了一顿传统的中国餐”。这让我或者笔据它对需求的意会去再次建议修改建议。
腾讯混元助手的两张图既把饺子形成了包子,还烦躁其妙在中间放了一碟辣椒。
第三说念题则更具蛊卦性,我试图让AI搞懂狗和狗不睬包子的关系。
我最初让每个AI器具画一桌天津狗不睬包子,接着条目把图改成“一只狗在吃狗不睬包子”,又让它把狗的相貌换成玄色、把图片换成漫画风。
文心一言前两轮阐述很可以,既有狗不睬包子也有狗,但后两张图让我大跌眼镜,黑漆漆的包子属实很阴私,况兼第四张图包子“流露”了,有一种往烧麦生成的嗅觉。
智谱清言的四张图,我每一张条目它修改的细节齐涵盖很到位,好意思中不及的是为什么包子会接连形成馒头、汉堡包和一大块面包?
腾讯混元助手径直在中间将狗放到了包子盘中,不外狗的相貌如实篡改的很到位,后两张图的包子相似形成了汉堡包。
06.
结语:AI绘画器具对比
图片氛围感拉满,碰到真的物体就歇菜
从我深度体验国产10款AI绘画器具的感受来看,AI在一些氛围感较强、莫得指明具体包含成分的图片生成上阐述较好,但一朝指定生成狗、包子、饺子等具体可以物体时,就会出现奇怪的图片。不外当碰上春节氛围或者青花瓷立场,这些需要AI自主创作更多的画面时,它络续能带给我惊喜,有些致使可以拿来即用。
刚运行,AI绘画器具因为对松鼠“跪”鱼、车/水/马/龙等的仙葩意会闹出不少乌龙,但当今跟着其图像生成后果越来越传神,对细节的描摹也很精细,我对这些器具的印象也大大改不雅。
不外关于更资深的绘画使命者而言,AI在描摹物体方面庞易犯错的问题特别致命。当东说念主们想要用AI来为竹帛配图、宣传海报生成图片晌,非资深东说念主士很难发现AI生成的鸟爪、动物形象等是否恰当客不雅情况韩国主播,海报上的笔墨、祥瑞物形象若是不可被一下子看懂或者出现一些不恰当常理的推行也会让传播后果大打扣头,因此这亦然我但愿AI绘画器具下一步亟需改良的所在。