揭秘神秘“小熊猫”模型，实测对比Recraft V3生成效果

302.AI

2024-11-01

872

【建站扶持计划】

免订阅费，免费SEO与代建站，16大主流媒体免费开户

立即查看>>

导读：10月31日，Recraft AI在社交媒体上宣布，这一备受关注的神秘模型red_panda（小熊猫）正是他们推出的最新图像生成模型Recraft V3。

近日，一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首，这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。

有网友猜测小熊猫会不会是Midjourney的新产物，也有网友猜测可能是来自OpenAI：

甚至有网友猜测，因为熊猫生活在亚洲，而中国公司在视频生成方面表现卓越，所以猜测它来自像百度或腾讯这样的中国科技公司：

就在10月的最后一天，谜底揭开了！

10月31日，Recraft AI在社交媒体上宣布，这一备受关注的神秘模型red_panda（小熊猫）正是他们推出的最新图像生成模型Recraft V3。

根据Recraft AI官方称，Recraft的新模型质量高于 Midjourney、OpenAI 和所有其他主要图像生成公司的模型。Recraft V3的主要优势体现在：

1、能够遵循和理解提示词，并生成具有复杂场景的图像，包括提示中提到的物体的正确数量、颜色和位置，

2、在人物生成方面，能够确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。

3、同时官方还宣称，Recraft V3在文本生成质量方面非常高，是世界上唯一一个能够生成带有长文本图像的模型。

新模型出现，按照惯例肯定要实测看看真实效果如何，302.AI的绘画机器人已经提供了最新的Recraft V3模型，用户可以进入302.AI快速使用Recraft V3模型，无需下载额外的软件。

302.AI的绘画机器人提供了多种图像生成模型，能够快速选择不同模型使用，满足用户不同的需求，更重要的是，能够轻松对比不同模型的效果。接下来，就使用302.AI实测对比下Recraft V3与其他模型的效果。

> 使用教程：

1、进入302.AI，在侧边栏找到绘画机器人，选择模型后点击【创建绘画机器人】，比如首先选择Recraft V3模型；

2、进入绘画机器人的绘画页面，可以看到输入框右侧会有设置，这里可以设置图片比例、风格提示词等；

3、完成设置后，即可在输入框输入提示词生成图片；

> 多模型对比

(以下所有案例均由302.AI绘画机器人生成)

1、长文字海报：

提示词：一张可爱的漫画风平面海报，有生日的元素，海报上方用艺术字体写着“302.AI” ，另外用正楷写着“Happy birthday to you!Happy every day, happy life, no worries.And all wishes come true!”

首先，从生成的海报中的文字准确性上来看，Ideogram和Recraft V3的表现非常出色，文字很准确，而Midjourney生成的海报中出现了一些多余的字母单词，Flux-Pro V1.1生成的海报只有两个单词：

2、人物写实：

提示词：一位年轻女性微笑着在舞台上发言，来自大疆，白色背景，企业标志被模糊处理，科技会议

在人物写实方面，先看背景，可以看到Recraft V3生成的图片背景不仅有大疆的logo还出现了一个无人机的图案，是四个模型中表现最好的，但是在人物方面，Recraft V3的人物四肢都很真实，不过仔细看牙齿，就能看到人物的牙齿的结构并不像真实的牙齿结构，根据对比这次表现最好的是Ideogram，Midjourney虽然人物非常写实，但是背景并没有出现提示词中提到的大疆，Flux-Pro V1.1背景的logo则是出现了错误：

3、复杂场景：

提示词：模仿产品拍摄，在一个非常干净的桌子上垫着一张浅色桌布，桌面放着三个红色的圆柱体，一个绿色长方体和两个黄色圆锥体

最后是复杂场景的对比，根据Recraft V3官网的介绍，Recraft V3能够准确遵循提示词，生成复杂场景。但在实测中，效果并没有达到预期，在生成的过程中，尝试了用中文和英文提示词生成，效果还是不理想，Recraft V3主要是把“三个红色圆柱体”和“两个黄色圆锥体”搞混了，而其他的模型，Midjourney、Flux-Pro V1.1和Ideogram的表现较差：

PS：为更直观地评估每个模型在初始状态下的表现能力，以上模型展示的效果，均是模型第一次生成的效果。

> API接入

最后，302.AI的API超市也上线了Recraft V3模型的API，能够自定义风格，支持在线调试，这使得开发者可以快速集成和使用API服务，并且大大节省了开发成本。

> 总结

综合来看，Recraft V3在长文本生成方面能够准确生成，表现十分不错。但在人物图像的生成上仿真准确度仍有提升空间，特别是在处理细微面部特征时，例如牙齿结构，这种细节的真实感有待进一步优化。

对于提示词生成复杂场景的能力，Recraft V3当前的表现尚未完全达到其官方声称的水平，特别是在物体数量和颜色的辨识上存在混淆，这可能与算法的训练数据相关，相信随着技术的迭代与优化，未来会有更好的表现。

总之，随着技术的进一步发展和用户反馈的不断改进，相信Recraft V3的潜力将会被不断挖掘和实现。

文章来源：【302.AI】公众号

【声明】该内容为作者个人观点，大数跨境仅提供信息存储空间服务，不代表大数跨境观点或立场。版权归原作者所有，未经允许不得转载。如发现本站文章存在版权问题，请联系：contact@10100.com

 0

 0

302.AI