AI文生图提示词入门

想要实现文生图且需要保持人物一致性的提示词写作，核心逻辑是：先锁定”不变”的身份特征，再描述”可变”的场景/动作，最后用负面提示词防止漂移

一、提示词如何写：从入门到精通

1. 基础模板：固定外貌特征 + 场景/动作变化

这是最简单的入门公式，适用于大多数新手场景

格式：

[固定外貌特征] + 在[场景1]中做[动作1]，风格为[具体风格]

示例：

棕红色长卷发、琥珀色眼睛、佩戴银色项链的女性 + 在复古咖啡馆中低头翻看书籍，风格为电影感写实
同上人物 + 在海边漫步并轻轻撩动头发，风格为清新日系

关键点：固定特征要写清楚（发色、发型、眼睛颜色、标志性配饰），后续生成时直接复制这段描述。

2. 进阶模板：角色卡 + 任务 + 约束

当你需要更高精度或系列化生成时，推荐使用”角色卡”模式

完整模块化提示词结构

[角色卡] + [全局风格和相机] + [特定任务] + [精确的编辑说明] + [约束/否定] + [输出构图]

第一步：创建”角色卡”（身份锚点）

角色卡是你角色的”身份证”，包含所有必须保持不变的特征。建议保存为文档，每次生成时粘贴使用

示例角色卡（真人风格）：

身份：28岁女性，椭圆形脸，暖棕色眼睛，中等棕褐色皮肤，齐肩波浪深棕色头发（带微妙高光），鼻子上有自然雀斑
服装基线：极简主义定制西装外套（炭黑色），白色圆领T恤，小金耳环
身材基线：170厘米，纤细健美
一致性规则：保留面部身份、肤色、雀斑、头发长度/发型、耳环；保持真实比例

示例角色卡（二次元风格）：

3D皮克斯风格，古代小女孩，黄色汉服，双丸子头，圆脸杏眼，腮红明显

第二步：组合完整提示词

模板1：更换背景/服装，保持面部不变

[角色卡]
任务：保持面部、头发、耳环完全不变。将背景替换为阳光明媚的极简主义办公室，柔和的散景，来自相机左侧的自然窗光。
相机真实感：50mm定焦镜头，f/2.0，ISO 200，1/250，色温5200K
否定：没有面部变形，没有头发长度变化，没有添加配饰，没有过度平滑

模板2：改变姿势，保持身份

[角色卡]
任务：相同的主体，相同的服装。过渡到坐在凳子上的姿势，3/4侧面，双手可见（自然手指位置），肩膀放松。
光照：双灯设置，主光45°相机右侧（柔光箱），轮廓光相机左侧
否定：没有手指计数错误，没有扭曲手腕，没有面部变窄，没有发际线变化

模板3：参考图 + 指定变化（即梦AI专用）

参考图：[上传之前生成的最佳人像]
新增：更换为操场打篮球场景，保留发型和卫衣款式
风格：青春校园风
参数：参考强度70%（五官一致，动作自然）

3. 高级技巧：让提示词更有效

① 使用硬性否定词

负面提示词要具体，不要只说”不要变脸”，而要明确指出要阻止什么漂移

要防止的漂移	有效否定提示词
脸型变化	没有面部变形，没有下颌线改变，没有脸型瘦化
眼睛颜色	没有眼睛颜色变化，没有蓝色/绿色眼睛
头发变化	没有头发长度改变，没有发色变浅，没有刘海
皮肤质感	没有过度平滑，没有塑料皮肤，没有美颜滤镜
添加物	没有添加的珠宝，没有纹身，没有穿孔

② 锁定相机和光照参数

一致的拍摄参数能大幅减少风格漂移

相机：35mm定焦镜头，f/2.8，ISO 200，1/250
光照：柔光箱45°，自然窗光，中性白平衡（5200K）
纹理：保留皮肤纹理和微对比度，添加细微胶片颗粒

③ 每次只改一个变量

迭代编辑原则：一次只改变一个要素（背景、服装、姿势或光照），不要同时改多个，否则漂移风险剧增

④ 指定材料质感

写服装时描述材质，能让AI更准确地保持一致性：

❌ 错误：穿夹克
✅ 正确：哑光黑色皮夹克，带有织物褶皱和镜面高光

⑤ 处理手部和细节

复杂姿势容易导致手部出错，提前说明：

双手可见，自然手指张开，每只手五个手指，没有重叠

4. 实战示例：完整提示词组合

目标：用同一角色，生成三张不同场景的图（咖啡馆、海边、城市夜景）

角色卡（保存为模板）：

Aria Novak，椭圆脸、带琥珀色斑点的淡褐色眼睛、雀斑中等浅肤色、深棕色波浪鲍伯头（侧边刘海）、细银色圈形耳环；海军蓝飞行员夹克+白色T恤

第一张：咖啡馆场景

Aria Novak，保留面部、头发、耳环完全不变。坐在复古咖啡馆窗边，低头看书，柔和的窗光从左照射，浅景深。相机：50mm f/2.0，暖色调。否定：没有面部变形，没有头发变化，没有添加配饰。

第二张：海边场景

Aria Novak，保留面部、头发、耳环不变。在海边漫步，轻轻撩动头发，夕阳金色时刻，侧光，发丝有光晕。相机：35mm f/2.8，自然色彩。否定：同上。

第三张：城市夜景

Aria Novak，保留面部、头发、耳环不变。站在城市天台，背景是霓虹灯夜景，蓝色时刻，柔和的边缘光。相机：50mm f/1.8，微冷色调。否定：同上。

二、使用什么工具

目前市面上有多种工具可以实现人物一致性，根据你的技术水平和需求选择。

新手推荐：即梦AI / 豆包

特点：操作简单，有中文界面，提供”参考图”功能，无需训练模型。

即梦AI操作步骤：

上传参考图：选择一张之前生成的满意角色图（正面、清晰、无遮挡）
设置参考强度：
- 建议70%左右：既能保持五官一致，又不至于让动作僵硬
- 如果脸容易变，调高到80-85%
编写提示词：参考上面模板，描述新场景
选择模型：通用v1.4等模型在角色保持方面表现较好
生成并筛选：对比结果，选择最像的

豆包操作：同样支持参考图+文字描述，可用”同上人物”简化后续生成。

收费：新用户送免费点数，后续按张计费（约0.1-0.3元/张）

进阶玩家：Qwen-Image-Edit / 字节USO / 腾讯InstantCharacter

如果你想要更高精度或需要本地部署，可以尝试开源工具。

① Qwen-Image-Edit-2509（阿里通义）

核心优势：

多图编辑支持：可输入”人物+人物”、”人物+场景”等多张参考图
单图一致性增强：人脸ID保持能力显著提升
支持姿势变换：通过关键点图控制新姿势，同时保持长相

适用场景：需要精确控制人物姿势、制作表情包、老照片修复

如何使用：访问Qwen Chat，选择”图像编辑”功能，上传参考图并输入描述

② 字节USO（开源框架）

核心优势：

单一模型搞定主体保持+风格迁移
支持”主体驱动”、”风格驱动”、”混合驱动”三种模式
可同时参考人物ID和风格图片，生成”这个人+这种风格”的结果

适用场景：需要同时保持人物长相和统一艺术风格（如吉卜力风、水墨风）

如何使用：

HuggingFace在线demo：直接上传参考图体验
本地部署：有技术基础可克隆GitHub仓库

③ 腾讯InstantCharacter（Flux插件）

核心优势：

高保真角色定制，支持任意姿势、任意场景
兼容开源文生图模型Flux
无需针对每个角色微调，快速生成

适用场景：连环画、影片创作、虚拟偶像、游戏角色

如何使用：

访问GitHub或HuggingFace搜索”InstantCharacter”
克隆仓库，安装依赖
准备一张角色图+文字描述，运行模型

④ Seedream 4.0 / Gemini 2.5 Flash Image

这些是海外主流模型，适合有英文提示词基础的用户。支持”外观锁定”参数（70-85%），可精确控制面部保留程度。

Seedream 4.0关键设置：

上传参考图，启用”外观锁定”（设定70-85%）
固定Seed值（同一系列用相同seed）
CFG引导尺度设为7-8（平衡遵循提示和创造力）
步骤数20-30

工具选择指南

你的需求	推荐工具	难度
新手入门，中文界面，快速出图	即梦AI / 豆包	⭐ 简单
需要精确控制姿势/表情	Qwen-Image-Edit	⭐⭐ 中等
需要同时保持人物+统一风格	字节USO	⭐⭐ 中等
需要Flux生态、角色定制	腾讯InstantCharacter	⭐⭐⭐ 需部署
英文好，追求电影级质感	Seedream 4.0 / Gemini	⭐⭐ 中等

注：非原创，来源于网络。