AI文生图提示词入门
想要实现文生图且需要保持人物一致性的提示词写作,核心逻辑是:先锁定”不变”的身份特征,再描述”可变”的场景/动作,最后用负面提示词防止漂移
一、提示词如何写:从入门到精通
1. 基础模板:固定外貌特征 + 场景/动作变化
这是最简单的入门公式,适用于大多数新手场景
格式:
1 | [固定外貌特征] + 在[场景1]中做[动作1],风格为[具体风格] |
示例:
- 棕红色长卷发、琥珀色眼睛、佩戴银色项链的女性 + 在复古咖啡馆中低头翻看书籍,风格为电影感写实
- 同上人物 + 在海边漫步并轻轻撩动头发,风格为清新日系
关键点:固定特征要写清楚(发色、发型、眼睛颜色、标志性配饰),后续生成时直接复制这段描述。
2. 进阶模板:角色卡 + 任务 + 约束
当你需要更高精度或系列化生成时,推荐使用”角色卡”模式
完整模块化提示词结构
1 | [角色卡] + [全局风格和相机] + [特定任务] + [精确的编辑说明] + [约束/否定] + [输出构图] |
第一步:创建”角色卡”(身份锚点)
角色卡是你角色的”身份证”,包含所有必须保持不变的特征。建议保存为文档,每次生成时粘贴使用
示例角色卡(真人风格):
1 | 身份:28岁女性,椭圆形脸,暖棕色眼睛,中等棕褐色皮肤,齐肩波浪深棕色头发(带微妙高光),鼻子上有自然雀斑 |
示例角色卡(二次元风格):
1 | 3D皮克斯风格,古代小女孩,黄色汉服,双丸子头,圆脸杏眼,腮红明显 |
第二步:组合完整提示词
模板1:更换背景/服装,保持面部不变
1 | [角色卡] |
模板2:改变姿势,保持身份
1 | [角色卡] |
模板3:参考图 + 指定变化(即梦AI专用)
1 | 参考图:[上传之前生成的最佳人像] |
3. 高级技巧:让提示词更有效
① 使用硬性否定词
负面提示词要具体,不要只说”不要变脸”,而要明确指出要阻止什么漂移
| 要防止的漂移 | 有效否定提示词 |
|---|---|
| 脸型变化 | 没有面部变形,没有下颌线改变,没有脸型瘦化 |
| 眼睛颜色 | 没有眼睛颜色变化,没有蓝色/绿色眼睛 |
| 头发变化 | 没有头发长度改变,没有发色变浅,没有刘海 |
| 皮肤质感 | 没有过度平滑,没有塑料皮肤,没有美颜滤镜 |
| 添加物 | 没有添加的珠宝,没有纹身,没有穿孔 |
② 锁定相机和光照参数
一致的拍摄参数能大幅减少风格漂移
1 | 相机:35mm定焦镜头,f/2.8,ISO 200,1/250 |
③ 每次只改一个变量
迭代编辑原则:一次只改变一个要素(背景、服装、姿势或光照),不要同时改多个,否则漂移风险剧增
④ 指定材料质感
写服装时描述材质,能让AI更准确地保持一致性:
- ❌ 错误:穿夹克
- ✅ 正确:哑光黑色皮夹克,带有织物褶皱和镜面高光
⑤ 处理手部和细节
复杂姿势容易导致手部出错,提前说明:
1 | 双手可见,自然手指张开,每只手五个手指,没有重叠 |
4. 实战示例:完整提示词组合
目标:用同一角色,生成三张不同场景的图(咖啡馆、海边、城市夜景)
角色卡(保存为模板):
1 | Aria Novak,椭圆脸、带琥珀色斑点的淡褐色眼睛、雀斑中等浅肤色、深棕色波浪鲍伯头(侧边刘海)、细银色圈形耳环;海军蓝飞行员夹克+白色T恤 |
第一张:咖啡馆场景
1 | Aria Novak,保留面部、头发、耳环完全不变。坐在复古咖啡馆窗边,低头看书,柔和的窗光从左照射,浅景深。相机:50mm f/2.0,暖色调。否定:没有面部变形,没有头发变化,没有添加配饰。 |
第二张:海边场景
1 | Aria Novak,保留面部、头发、耳环不变。在海边漫步,轻轻撩动头发,夕阳金色时刻,侧光,发丝有光晕。相机:35mm f/2.8,自然色彩。否定:同上。 |
第三张:城市夜景
1 | Aria Novak,保留面部、头发、耳环不变。站在城市天台,背景是霓虹灯夜景,蓝色时刻,柔和的边缘光。相机:50mm f/1.8,微冷色调。否定:同上。 |
二、使用什么工具
目前市面上有多种工具可以实现人物一致性,根据你的技术水平和需求选择。
新手推荐:即梦AI / 豆包
特点:操作简单,有中文界面,提供”参考图”功能,无需训练模型。
即梦AI操作步骤:
- 上传参考图:选择一张之前生成的满意角色图(正面、清晰、无遮挡)
- 设置参考强度:
- 建议70%左右:既能保持五官一致,又不至于让动作僵硬
- 如果脸容易变,调高到80-85%
- 编写提示词:参考上面模板,描述新场景
- 选择模型:通用v1.4等模型在角色保持方面表现较好
- 生成并筛选:对比结果,选择最像的
豆包操作:同样支持参考图+文字描述,可用”同上人物”简化后续生成。
收费:新用户送免费点数,后续按张计费(约0.1-0.3元/张)
进阶玩家:Qwen-Image-Edit / 字节USO / 腾讯InstantCharacter
如果你想要更高精度或需要本地部署,可以尝试开源工具。
① Qwen-Image-Edit-2509(阿里通义)
核心优势:
- 多图编辑支持:可输入”人物+人物”、”人物+场景”等多张参考图
- 单图一致性增强:人脸ID保持能力显著提升
- 支持姿势变换:通过关键点图控制新姿势,同时保持长相
适用场景:需要精确控制人物姿势、制作表情包、老照片修复
如何使用:访问Qwen Chat,选择”图像编辑”功能,上传参考图并输入描述
② 字节USO(开源框架)
核心优势:
- 单一模型搞定主体保持+风格迁移
- 支持”主体驱动”、”风格驱动”、”混合驱动”三种模式
- 可同时参考人物ID和风格图片,生成”这个人+这种风格”的结果
适用场景:需要同时保持人物长相和统一艺术风格(如吉卜力风、水墨风)
如何使用:
- HuggingFace在线demo:直接上传参考图体验
- 本地部署:有技术基础可克隆GitHub仓库
③ 腾讯InstantCharacter(Flux插件)
核心优势:
- 高保真角色定制,支持任意姿势、任意场景
- 兼容开源文生图模型Flux
- 无需针对每个角色微调,快速生成
适用场景:连环画、影片创作、虚拟偶像、游戏角色
如何使用:
- 访问GitHub或HuggingFace搜索”InstantCharacter”
- 克隆仓库,安装依赖
- 准备一张角色图+文字描述,运行模型
④ Seedream 4.0 / Gemini 2.5 Flash Image
这些是海外主流模型,适合有英文提示词基础的用户。支持”外观锁定”参数(70-85%),可精确控制面部保留程度。
Seedream 4.0关键设置:
- 上传参考图,启用”外观锁定”(设定70-85%)
- 固定Seed值(同一系列用相同seed)
- CFG引导尺度设为7-8(平衡遵循提示和创造力)
- 步骤数20-30
工具选择指南
| 你的需求 | 推荐工具 | 难度 |
|---|---|---|
| 新手入门,中文界面,快速出图 | 即梦AI / 豆包 | ⭐ 简单 |
| 需要精确控制姿势/表情 | Qwen-Image-Edit | ⭐⭐ 中等 |
| 需要同时保持人物+统一风格 | 字节USO | ⭐⭐ 中等 |
| 需要Flux生态、角色定制 | 腾讯InstantCharacter | ⭐⭐⭐ 需部署 |
| 英文好,追求电影级质感 | Seedream 4.0 / Gemini | ⭐⭐ 中等 |
注:非原创,来源于网络。
- 标题: AI文生图提示词入门
- 作者: WenJun.Zuo
- 创建于 : 2026-03-27 23:35:00
- 更新于 : 2026-03-27 23:35:00
- 链接: https://www.zuowenjun.cn//2026/03/11/ai-text-to-picture/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。