AI文生图提示词入门

WenJun.Zuo ITer

想要实现文生图且需要保持人物一致性的提示词写作,核心逻辑是:先锁定”不变”的身份特征,再描述”可变”的场景/动作,最后用负面提示词防止漂移

一、提示词如何写:从入门到精通

1. 基础模板:固定外貌特征 + 场景/动作变化

这是最简单的入门公式,适用于大多数新手场景

格式

1
[固定外貌特征] + 在[场景1]中做[动作1],风格为[具体风格]

示例

  • 棕红色长卷发、琥珀色眼睛、佩戴银色项链的女性 + 在复古咖啡馆中低头翻看书籍,风格为电影感写实
  • 同上人物 + 在海边漫步并轻轻撩动头发,风格为清新日系

关键点:固定特征要写清楚(发色、发型、眼睛颜色、标志性配饰),后续生成时直接复制这段描述。

2. 进阶模板:角色卡 + 任务 + 约束

当你需要更高精度或系列化生成时,推荐使用”角色卡”模式

完整模块化提示词结构

1
[角色卡] + [全局风格和相机] + [特定任务] + [精确的编辑说明] + [约束/否定] + [输出构图]

第一步:创建”角色卡”(身份锚点)

角色卡是你角色的”身份证”,包含所有必须保持不变的特征。建议保存为文档,每次生成时粘贴使用

示例角色卡(真人风格)

1
2
3
4
身份:28岁女性,椭圆形脸,暖棕色眼睛,中等棕褐色皮肤,齐肩波浪深棕色头发(带微妙高光),鼻子上有自然雀斑
服装基线:极简主义定制西装外套(炭黑色),白色圆领T恤,小金耳环
身材基线:170厘米,纤细健美
一致性规则:保留面部身份、肤色、雀斑、头发长度/发型、耳环;保持真实比例

示例角色卡(二次元风格)

1
3D皮克斯风格,古代小女孩,黄色汉服,双丸子头,圆脸杏眼,腮红明显

第二步:组合完整提示词

模板1:更换背景/服装,保持面部不变

1
2
3
4
[角色卡]
任务:保持面部、头发、耳环完全不变。将背景替换为阳光明媚的极简主义办公室,柔和的散景,来自相机左侧的自然窗光。
相机真实感:50mm定焦镜头,f/2.0,ISO 200,1/250,色温5200K
否定:没有面部变形,没有头发长度变化,没有添加配饰,没有过度平滑

模板2:改变姿势,保持身份

1
2
3
4
[角色卡]
任务:相同的主体,相同的服装。过渡到坐在凳子上的姿势,3/4侧面,双手可见(自然手指位置),肩膀放松。
光照:双灯设置,主光45°相机右侧(柔光箱),轮廓光相机左侧
否定:没有手指计数错误,没有扭曲手腕,没有面部变窄,没有发际线变化

模板3:参考图 + 指定变化(即梦AI专用)

1
2
3
4
参考图:[上传之前生成的最佳人像]
新增:更换为操场打篮球场景,保留发型和卫衣款式
风格:青春校园风
参数:参考强度70%(五官一致,动作自然)

3. 高级技巧:让提示词更有效

① 使用硬性否定词

负面提示词要具体,不要只说”不要变脸”,而要明确指出要阻止什么漂移

要防止的漂移 有效否定提示词
脸型变化 没有面部变形,没有下颌线改变,没有脸型瘦化
眼睛颜色 没有眼睛颜色变化,没有蓝色/绿色眼睛
头发变化 没有头发长度改变,没有发色变浅,没有刘海
皮肤质感 没有过度平滑,没有塑料皮肤,没有美颜滤镜
添加物 没有添加的珠宝,没有纹身,没有穿孔

② 锁定相机和光照参数

一致的拍摄参数能大幅减少风格漂移

1
2
3
相机:35mm定焦镜头,f/2.8,ISO 200,1/250
光照:柔光箱45°,自然窗光,中性白平衡(5200K)
纹理:保留皮肤纹理和微对比度,添加细微胶片颗粒

③ 每次只改一个变量

迭代编辑原则:一次只改变一个要素(背景、服装、姿势或光照),不要同时改多个,否则漂移风险剧增

④ 指定材料质感

写服装时描述材质,能让AI更准确地保持一致性:

  • ❌ 错误:穿夹克
  • ✅ 正确:哑光黑色皮夹克,带有织物褶皱和镜面高光

⑤ 处理手部和细节

复杂姿势容易导致手部出错,提前说明:

1
双手可见,自然手指张开,每只手五个手指,没有重叠

4. 实战示例:完整提示词组合

目标:用同一角色,生成三张不同场景的图(咖啡馆、海边、城市夜景)

角色卡(保存为模板):

1
Aria Novak,椭圆脸、带琥珀色斑点的淡褐色眼睛、雀斑中等浅肤色、深棕色波浪鲍伯头(侧边刘海)、细银色圈形耳环;海军蓝飞行员夹克+白色T恤

第一张:咖啡馆场景

1
Aria Novak,保留面部、头发、耳环完全不变。坐在复古咖啡馆窗边,低头看书,柔和的窗光从左照射,浅景深。相机:50mm f/2.0,暖色调。否定:没有面部变形,没有头发变化,没有添加配饰。

第二张:海边场景

1
Aria Novak,保留面部、头发、耳环不变。在海边漫步,轻轻撩动头发,夕阳金色时刻,侧光,发丝有光晕。相机:35mm f/2.8,自然色彩。否定:同上。

第三张:城市夜景

1
Aria Novak,保留面部、头发、耳环不变。站在城市天台,背景是霓虹灯夜景,蓝色时刻,柔和的边缘光。相机:50mm f/1.8,微冷色调。否定:同上。

二、使用什么工具

目前市面上有多种工具可以实现人物一致性,根据你的技术水平和需求选择。

新手推荐:即梦AI / 豆包

特点:操作简单,有中文界面,提供”参考图”功能,无需训练模型。

即梦AI操作步骤

  1. 上传参考图:选择一张之前生成的满意角色图(正面、清晰、无遮挡)
  2. 设置参考强度
    • 建议70%左右:既能保持五官一致,又不至于让动作僵硬
    • 如果脸容易变,调高到80-85%
  3. 编写提示词:参考上面模板,描述新场景
  4. 选择模型:通用v1.4等模型在角色保持方面表现较好
  5. 生成并筛选:对比结果,选择最像的

豆包操作:同样支持参考图+文字描述,可用”同上人物”简化后续生成。

收费:新用户送免费点数,后续按张计费(约0.1-0.3元/张)

进阶玩家:Qwen-Image-Edit / 字节USO / 腾讯InstantCharacter

如果你想要更高精度或需要本地部署,可以尝试开源工具。

① Qwen-Image-Edit-2509(阿里通义)

核心优势

  • 多图编辑支持:可输入”人物+人物”、”人物+场景”等多张参考图
  • 单图一致性增强:人脸ID保持能力显著提升
  • 支持姿势变换:通过关键点图控制新姿势,同时保持长相

适用场景:需要精确控制人物姿势、制作表情包、老照片修复

如何使用:访问Qwen Chat,选择”图像编辑”功能,上传参考图并输入描述

② 字节USO(开源框架)

核心优势

  • 单一模型搞定主体保持+风格迁移
  • 支持”主体驱动”、”风格驱动”、”混合驱动”三种模式
  • 可同时参考人物ID和风格图片,生成”这个人+这种风格”的结果

适用场景:需要同时保持人物长相和统一艺术风格(如吉卜力风、水墨风)

如何使用

  • HuggingFace在线demo:直接上传参考图体验
  • 本地部署:有技术基础可克隆GitHub仓库

③ 腾讯InstantCharacter(Flux插件)

核心优势

  • 高保真角色定制,支持任意姿势、任意场景
  • 兼容开源文生图模型Flux
  • 无需针对每个角色微调,快速生成

适用场景:连环画、影片创作、虚拟偶像、游戏角色

如何使用

  1. 访问GitHub或HuggingFace搜索”InstantCharacter”
  2. 克隆仓库,安装依赖
  3. 准备一张角色图+文字描述,运行模型

④ Seedream 4.0 / Gemini 2.5 Flash Image

这些是海外主流模型,适合有英文提示词基础的用户。支持”外观锁定”参数(70-85%),可精确控制面部保留程度。

Seedream 4.0关键设置

  • 上传参考图,启用”外观锁定”(设定70-85%)
  • 固定Seed值(同一系列用相同seed)
  • CFG引导尺度设为7-8(平衡遵循提示和创造力)
  • 步骤数20-30

工具选择指南

你的需求 推荐工具 难度
新手入门,中文界面,快速出图 即梦AI / 豆包 ⭐ 简单
需要精确控制姿势/表情 Qwen-Image-Edit ⭐⭐ 中等
需要同时保持人物+统一风格 字节USO ⭐⭐ 中等
需要Flux生态、角色定制 腾讯InstantCharacter ⭐⭐⭐ 需部署
英文好,追求电影级质感 Seedream 4.0 / Gemini ⭐⭐ 中等

注:非原创,来源于网络。

  • 标题: AI文生图提示词入门
  • 作者: WenJun.Zuo
  • 创建于 : 2026-03-27 23:35:00
  • 更新于 : 2026-03-27 23:35:00
  • 链接: https://www.zuowenjun.cn//2026/03/11/ai-text-to-picture/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
 评论