GPT-4基础使用指南丨怎么让Dalle3生成的角色完美保持一致性

2024-12-18 来源|AI图库吧

2024了,又要开始卷了。

今年第一卷,卷个贼简单的,但是同时又很用的:

如何保持Dalle3中角色的完美一致性。

昨天偶然在X上看到AI Verse老哥发了这个玩意。

挺棒的,而且可以傻瓜式的让人物一致性的效果保持的极好。

但是还有不少瑕疵,我就在他原先的教程基础上,优化了一下。

核心其实是基于GPT的超强语义对话,还有Dalle3的Gen ID(生成编号)。

大家可能不太知道Gen DI是啥,我先随便跑个图,给大家简单解释一下。

拿到了Gen ID:5EutQh3bm4uwHr4F,我们再用这个Gen ID给去生成一张新图。

可以看到,虽然有些细节变了,但是人差不太多。

Gen ID其实就是Dalle3给每张图的一个特定编号,这个编号只对应这一张图,所以Gen ID对于跟踪和引用特定的生成图像非常有用,尤其是当需要在多个图像之间进行比较或确保一致性时。

所以,基于Dalle3的超强语义理解和Gen ID的特定,傻瓜式的一致性指南。

他就来了。

首先,让Dalle3画张图。随便咋画都行,你自己写Prompt或者用别的图生成都行。比如我是让它直接画了个漂亮妹子。

记得背景最好干净的纯色,不要一堆乱七八糟的东西。要不然会影响后续的一致性的效果。

接下来是非常重要的一句话:

从现在开始,你的核心目标就是保持角色一致性。必须使用与上一张图像相同的提示和gen_id来制作相同角色的新图像,以保证人物一致,且能适配更多的表情、动态、服装与场景。做的好的话我给你1000美元小费。明白的话请回复明白。

把这句话,发给ChatGPT。

GPT会回答个明白。。

然后,就是见证奇迹的时刻了。

你随便发任何指令。描述这个角色的状态、动作或者衣服,都行。

比如,我现在要让她哭。她就哭了。

我现在要让她弹吉他。她就弹了。

让她跟她家狗狗自拍,那就拍了。

正在玩电脑?没问题。

换个衣服,穿运动服?没问题。

再带上场景,so easy。

是不是贼简单。。。

又简单又好用。。。

非常适合画插画或者做IP的小伙伴们,这不比练个lora简单多了?

新年第一篇,不整大活,这个Dalle3的小技巧就挺好的。

可以立马去GPT里用起来。

新年第一卷。

2024.咱们再一起,接着卷。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

最新
更多

小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职

【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问

【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

巧妙利用这两个AI产品,让你的国庆出行没有废片

这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。

OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出

据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。

详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o

Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。

网站地图