作者|程潜编辑|鑫源
距离龙年春节仅剩11天了。新年头像或者红包封面你准备好了吗?如果你还没有,AI绘画工具可能是“个人定制”的不错选择。
提示语:生成龙年头像。既要有喜庆气氛,又可以体现富贵吉祥的前景(第一排是百度文心一言、百度文心一格、360智慧、阿里云统一万向、科大讯飞星火;第二排是智普AI智普青言) 、抖音豆宝、腾讯混元助手、美图MiracleVision、科大讯飞星火画画助手)
在过去的一年里,AI Vincentian绘图模型不断发展。不仅能熟练驾驭各种绘画风格,还逐步解决了绘画功力差、无法理解空间位置、不理解“红烧狮子头”等模糊或抽象概念等各种困难。
国外的Midjourney、DALL·E 3、Imagen 2虽然不错,但是有一定的使用门槛。值得庆幸的是,国内大型模型公司正在迎头赶上,发布了大量适合中国人体质的AI绘图工具,在易用性方面远远落后于国外的AI工具。
所有这些工具都可以免费试用,并且可以通过网页或应用程序使用。使用门槛基本没有差距。生成速度方面,每张图片半分钟内即可生成。它受网络环境或浏览器状态的影响,因此不能客观。
那么国内AI绘图工具排名第一的玩家是谁呢?谁是能够帮助专业创作者提高效率、拯救绘画新手于水火之中的神器呢?要回答这个问题,我们需要考察两个关键能力:理解透彻和绘图精准。
为此,我对10款免费的国产AI文圣图工具进行了5个高级级别的体验对比。测试题包括但不限于日常思维、网络红人表情包、头像设计、公司年会、春节气氛、跨界组合、诗歌理解、多轮修改,看看哪个工具更得心应手能够瞬间更好地了解用户的想法。
综合来看,智普AI的智普轻言是目前综合性能最稳定的AI文字绘制工具。在10次测试中基本上都能生成符合我要求的图像。
然而,却有很多试题让大家翻车。比如,画出来的鹦鹉爪不仅形状怪异,而且数量也与现实不符;他们看不懂时下流行的“南方小土豆”,甚至还画出了“拿着糖葫芦”的动作。土豆串在一起; “福”字和春联写得像鬼符一样……
词语理解能力方面,智浦轻言、文心一言、科大讯飞星火、统一万象、混元助手表现较好。 360智画和美图奇迹在面对第一个问题“阿拉斯加”时就出错了,莫名其妙地将阿拉斯加画成了人/北极熊。
从画面精致程度来看,文字清晰、含义全面、文体化生成的春节气氛画面几乎可以立即使用;春晚宣传海报上,直接点名了龙年背景,结果综合全面。可以说,飞星火和抖音豆宝的吉祥物形象与传统的“龙”无关。
从多轮修改的可靠性来看,文心一言是每轮都坚持到底的玩家,智浦青言忠于最后一次的画面修改,而腾讯混元助手的表现可圈可点,有的每一步都有需求理解到位,但有些添加了一些奇怪的元素。总体而言,多轮修改是绘图和设计的必备技能,但基本上所有AI绘图工具都做不到。
为了保证比较的公平性,我在体验各个工具的生成能力时,都会参考第一张生成的图片。具体对比如下:
1.青铜难度:1-2个关键词。鸟爪和网络热词难以拆解。科大讯飞和智普AI表现不俗。第一阶段青铜难度的提示语比较简单。大多数这些提示都包含关键字。只有两个,包括生成图片中的主要人物,以及这个人物的地理位置、行为、图片大小、图片风格等关键要素之一。
第一个是“站在大楼屋顶上的阿拉斯加”,主要包括地理位置和阿拉斯加犬品种的了解。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
分别看这两个关键词,每个工具都通过对比或俯瞰周围楼层来呈现“站在大楼顶部”。大多数图像还突出了一些关键特征,例如大型阿拉斯加狗、黑白配色方案和长发。
但没想到的是,常见的犬种“阿拉斯加”竟然有一张与它完全无关的人工智能生成的图像。美丽的画面MiracleVision画了一只看起来像北极熊的动物站在大楼的屋顶上。 360智慧更进一步,画了一个站在楼顶上的男人。
第二个问题是生成“一只粉红色的鹦鹉站在树枝上”。该提示词的关键词主要有地理位置、粉色、鹦鹉等。这个问题的难点在于,鸟爪和人手一样,是困扰AI的一个难点。一些由人工智能生成的鸟爪图像经常具有扭曲和奇怪的形状。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
果然,10款AI绘画工具全部翻车。鹦鹉有对生的脚趾,两个脚趾向前,两个脚趾向后。但这些图有的把脚趾藏在树干后面,有的甚至画了脚趾,但数量和位置都是错误的。
然而这些AI生成的图片都呈现出“站在树枝上,粉红色”的特征,一眼就能认出是鹦鹉,却经不起仔细观察。
当我放大图片仔细观察时,统一万象、讯飞星火、讯飞星火绘画助手、奇迹视觉在鹦鹉眼睛的处理上也出现了错误。有的鹦鹉一侧有两只眼睛,有的鹦鹉一侧有两只眼睛。眼球很小并且完全扭曲。
第三个难点是“一根棒子上拿着糖葫芦的南方小土豆。‘南方小土豆’是东北人给游客起的绰号。”这个提示的主要难点是理解“棍子上拿着糖葫芦”和“南方小土豆是游客”。 ”。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
从结果来看,有的图片把土豆串成山楂,有的直接重新排列组合小土豆,还有的直接用土豆的卡通形象。
其中独特的是科大讯飞的两个AI工具,充分理解了“小土豆是游客”的概念,我终于在10张图片中看到了真人。
但没想到,所有的冰糖葫芦都被打翻了。唯有芝浦青岩的卡通形象,木棍上串着几颗红色的果子,与冰糖葫芦有些接近。
铜奖的最后一道题是“青花瓷风格画杉木”,明确了画面的风格。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
这个大问题的结果差距很大。有的在青花瓷器上画杉树,有的在杉树上画青花瓷图案,还有的用青花瓷相应的线条颜色直接呈现一幅画。
前两者虽然结合了青花瓷风格和杉木两大元素,但理解仍然不够准确。其中统一万象、智浦青烟、腾讯混元助手的图片甚至可以直接使用,他们直接将青花瓷风格融入到画作中。
不过,芝浦青岩的画有一个小bug:画的是杉树,而不是松树。
2、白银难度:关键词数量加倍,增加汉字、指定位置内容等白银阶段提示词难度。关键词数量从2个增加到5个以上,需要理解关键词的描述。
为了贴合即将到来的春节,第一题要求AI绘画工具生成“一张具有浓郁春节气氛的图画,需要包含灯笼、春联、“福”字。美丽的画面MiracleVision,其他的画面体现了热闹的春节气氛。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
为了降低难度,方便我快速找到图片中对应的元素,这道题只设置了三个明确的关键词:“灯笼、春联、‘福’字,但最终的结果并不完美。
智浦轻言和抖音豆包完全保留了三个要素,但汉字的呈现仍然是一个大问题。智浦青眼上的图片几乎看不到“福”字的轮廓,但春联和抖音豆宝上的“福”字全是一堆乱码。
其他工具生成的图片大多数只包含1-2 个元素。不过统一万向、科大讯飞星火、讯飞星火绘画助手、腾讯混元助手的春节气氛却很浓,整个画面看起来也很和谐。
第二题的关键词数量增加了一倍,包括“饺子、好吃、热气腾腾、色彩柔和、饱和度高、美食摄影、好看、定焦、超清”。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
一开始我以为这道题的门槛就是最后那一长串的限定符,没想到直接从“饺子”就开始翻车了。抖音豆宝、科大讯飞星火、讯飞星火画助手、统一万象、智浦青颜生成的图片可以看成是正宗的饺子,剩下的就直接“变异”成包子了。
第三个问题设置了一个难点,“某公司召开年会,图片右上角需要有年会主题的横幅。”年会横幅需在指定地点绘制。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
从气氛的表现上来说,这些AI工具画得还是很不错的。但360智华、统一万向、奇迹视觉的图片并没有理解“年会”的概念,而是直接省略了“年”字,生成了大家开会的图片。
在这个问题中,我没有非常精确地指定横幅的位置,我只是模糊地提到了“右上角”。从位置来看,抖音豆宝、讯飞Spark、讯飞Spark画画助手都有横幅和主题,但都直接在屏幕顶部。芝浦青岩图片右上角可以清晰看到横幅和标语。
白银阶段的最后一道题是“今年是龙年,画春晚宣传海报需要吉祥物”。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
春晚吉祥物历史悠久,龙也是中国传统文化的典型代表形象。 AI绘画确实在这两个元素的结合上给出了一些新的思路。有龙头、龙身、小恐龙形象等,有的甚至完全背离了龙的传统含义。
从最终的效果图来看,除了智浦青岩的图片有宣传海报的边框外,其他大部分都只有吉祥物图片和背景。
3、黄金难度:想象力发散测试,《鱼跃龙门》几乎难倒所有工具。黄金难度不仅考验AI绘画工具的想象力和创造力,还考验对一些误导性提示词的辨别能力。
第一篇的标题是“一部关于两个机器人共同登陆月球的四帧漫画”。四格漫画想要测试AI绘图工具能否呈现四张相互关联的图片。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
从结果来看,虽然单看画面无法理解四格漫画中所呈现的具体故事,但相似的人物、人物动作、背景变化都表现出连贯性。代表性的AI绘图工具是智浦青眼、抖音豆宝、美图奇迹视觉。虽然360智画生成的图片也呈现四格漫画,但更像是人类登陆月球的故事。
剩下的工具直接忽略了“四格漫画”这个关键词,只体现了“两个机器人携手”登陆月球。
第二个问题就更无厘头了,“蒙娜丽莎来中国应聘程序员的工作”。 AI绘图工具需要体现蒙娜丽莎、中国、程序员三个要素。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
文心一格、讯飞Spark、讯飞Spark绘画助手直接将蒙娜丽莎的经典形象与电脑结合起来。百度文心一言、360智慧、阿里云统一万向、智浦轻言、混元助手已彻底重新打造。前三张生成的图片可能是为了贴合中国元素,看起来更像中国人。芝浦青岩的形象更接近外国人的形象,而唯一体现“应用”的画面,混元助手则自行采用了漫画风格。
抖音豆宝和美图奇迹直接把蒙娜丽莎的原图搬到了图片上,只是调整了图片的背景,但并没有让我一眼就明白我想要体现的关键元素是什么。
第三个问题给AI绘画工具挖了个大坑,“一条叫‘松鼠鳜鱼’的鱼成功跃过了龙门。” AI需要躲避“松鼠鳜鱼”,准确获取并不是重点。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
“松鼠鳜鱼”问题仍然欺骗了1/2的AI工具。庆幸的是,之前的“松鼠跪在鱼面前”乌龙没有再出现。科大讯飞星火的画面体现了“鱼跃门”,智浦的清晰字样包括“龙”和“门”。美图MiracleVision就比较简单粗暴了,直接用文字打出中间鱼的名字。
4.白金难度:文字与图画直译,古诗词意境相差甚远。最后一个钻石难度是对古诗词的理解,体现了中国古代人的智慧。一般来说,古诗词中的几个词都包含着与社会背景、人物等相关的意境,因此,要求人工智能不仅能理解这首诗,还要将其与古诗词的语境结合起来。
为了循序渐进,一开始AI绘画工具收到的诗词都非常形象化,对物体和环境的描述很突出。
第一问是“墙角梅花几朵,凌寒独开”。单看句子的意思就可以看出,关键词是角、梅花、冷、开放。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
除了MiracleVision这种美图新手法外,其他工具均以“梅花”和“开放”作为画面的主要题材。闻心一言的画旁边还有诗和印章,更符合古代诗画的风格。闻心一阁、统一万象、智浦青烟、讯飞星火、讯飞星火画画助手、腾讯混元助手,屏幕上都有雪花,映照着“凌寒”。
枝浦青岩的梅花在角落里,但外观看起来更像是现代的墙,与古诗中暗示的时代不符。
第二题的古诗“黄河之水天上来,奔流到海不复回”也非常形象,但与梅花不同的是,这首诗中的“黄河”有一个指定目的。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
MiracleVision仍然很直接地将这首诗放置在画面的中间。抖音豆包、百度文心一言、百度文心一歌、阿里云统一万向的图片,更真实地再现了黄河,体现了“奔向大海”的气势。智浦轻颜、科大讯飞星火、科大讯飞星火绘画助手更注重呈现“黄”元素。
360智画虽然能感受到黄河,但河面太平静,没有汹涌的气势。
最后一题“定王天下之事,生前死后名声大噪”的难度在于形象不强,AI无法直接获取主要对象从字面意思看这首诗。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
从AI绘画工具生成的图片可以看出,大多数工具都以“王”作为图片的主要主题。统一万象是一座大宫殿,国王也从侧面映照出来。但《文心一言》和《文心一歌》呈现的是女性形象,似乎与古诗的字面意义没有联系。
MiracleVision 无法根据该提示词生成图片。
时将将军“醉,燃灯读剑,梦吹号连。八百里之外,烈日灼灼,寨外五十弦滚滚之声,将士号令”。战场之秋,马飞快,弓如霹雳弦。”全诗作为提醒,AI绘画工具生成的图像更符合古诗本身的意境,有战场上将军的形象。然而,美丽的画面MiracleVision仍然无法生成。
第一排左起:百度文信一言、百度文信一格、360智慧、阿里云统一万向、智普AI智普轻言;第二排左起:抖音豆宝、科大讯飞Spark、科大讯飞Spark 绘画助手、腾讯混元助手、MiracleVision
其中,芝浦清字左下有诗,比较符合古代诗画的风格。 360智汇和阿里云统一万向图片中只有一幅大概的图像,无法体现更宏大的场景。
5、钻石难度:经过多轮对话、反复修改,只有文馨坚持坚持到了最后。每个设计师都有N个版本的设计稿,所以如果我想让AI画出一张我满意的图,我需要反复提出要求。
然而,该细分市场只剩下三个竞争对手:文心一言、智浦轻言和腾讯混元助手。其他几个工具因不支持多轮对话等原因退出竞赛。
第一个问题依然延续了上面被很多AI工具打败的春节氛围图的提示语。
这次我变得更加困难,对AI工具生成的图片更加挑剔。在要求他们生成一张带有浓重春节气氛的图片,包括灯笼、春联、“福”字后,我不断提出新的修改要求,包括“图片更新”。 “真实”、“人多”、“画面里有人放鞭炮”等等,所有AI工具输入的文字都是一模一样的。
温心一言生成的四张图片中,除了对“写实”这个词缺乏理解之外,其他的改进都符合我的需求,可以看出接下来的图片基本没有偏离整体风格。上一个。
与温心一言相比,芝浦青言的四张图可以明显感觉到同一张图的内容在逐渐增多,但也都处于“写实”部分,而最后三张图依然是卡通动画风格。
腾讯混元助手的四张图片可谓风格迥异。每一项都是根据之前的所有要求重新创建的。不过,在对“现实主义”的理解上,混元助手也更胜一筹。最后三张明显感觉更真实。然而,在最后一张图中,浑源的助手画的是“放鞭炮”,而不是“放烟花”,根本找不到鞭炮在哪里。
第二题也是之前很多AI画图工具用来把饺子变成馒头的测试题的扩展版。
让各个AI工具画出刚出炉的饺子图后,我先后建议“让这盘饺子蒸起来”、“多拿几盘饺子”、“旁边多加几盘蔬菜”,一家人坐在一起吃这些菜”以及其他修改请求。
一共五轮对话,只有温心一个人坚持到了最后。芝浦清宴加了几个菜品失败,告诉我还没有构思,可以改成其他需要的。混元助理才坚持到饺子包好了。我一时激动地回答说:“我还没学会如何回答这个问题。”
不过乍一看,温心一言的前四张图几乎没有什么区别。虽然在第四张图片中你几乎看不到饺子周围有几个碗,但这些更像是蘸碗。上一部的气氛相当对,但是和上一个版本相比却没有任何修改,相当于推翻了一切。
虽然智浦青岩中只有三张图片,已经按照要求进行了更改,但是问题还是和以前一样。最后,饺子就变成了馒头。智浦青岩生成的每张图片都附有其对图片的理解和解释。例如,在第三张图片中,它提到“中心是一盘刚出炉的热气腾腾的饺子,周围是几盘其他各种中国菜肴。这些菜肴包括蔬菜、肉类和米饭,代表了传统的中国膳食。”这使我能够根据其对需求的理解再次提出更改建议。
腾讯混元助手的两张图不仅把饺子变成了包子,还莫名其妙地在中间放了一盘辣椒。
第三个问题更令人困惑。我试图让AI理解狗和狗不理包子之间的关系。
我先让每个AI工具画一张天津狗不理包子的桌子,然后要求它把图片改成“一只狗吃狗不理包子”,然后要求它把狗的颜色改成黑色,图片改成卡通风。
闻心一言前两轮的表现非常好,狗不理和狗子包子都有,但最后两张图让我大吃一惊。黑包子确实很少见,第四张图的包子就“暴露”了它们的秘密。有一种从烧麦中产生的感觉。
芝浦青烟的四张图片中,我要求它修改的每一个细节都被很好的覆盖了。唯一的问题是,为什么包子会依次变成馒头、汉堡和一大块面包?
腾讯混元助手直接把狗放在了中间的包子盘上,不过狗的颜色确实发生了很好的变化。最后两张图里的面包也变成了汉堡。
结论:AI绘画工具对比:画面充满气氛,但遇到实物就停下来了。从我对10款国产AI绘画工具的深入体验来看,AI在一些不指定具体元素的图片中,氛围感很强。在生成方面表现不错,但是一旦指定生成狗、包子、饺子等特定物体,就会出现奇怪的画面。然而,当遇到春节气氛或者青花瓷风格,需要AI独立创作更多的画面时,往往能让我惊喜,有的甚至可以开箱即用。
起初,AI绘画工具因为对松鼠“跪”在鱼、车/水/马/龙等方面的奇怪理解而犯了很多错误。但现在随着它的图像生成效果变得越来越真实,细节的描绘也非常详细,让我对这些工具的印象有了很大的改变。
然而,对于更有经验的画家来说,AI在描绘物体时容易出错的问题是非常致命的。当人们想要用AI为书籍插画、生成宣传海报的图片时,没有经验的人很难发现AI生成的鸟爪和动物图像是否与客观情况相符。如果海报上的文字和吉祥物形象不能让孩子看不懂或者出现一些不合理的内容,传播效果就会大打折扣。因此,这也是我希望AI绘画工具下一步需要改进的一个领域。