AI写真不像本人?加这一句话,相似度直接拉到95%

AI人像工具越来越强,但很多人上传照片后,生成的图变成了"陌生网红"或者"美化版原图"——相似度低、风格泛化、手部崩坏、姿势来回就那几个。

原因不难想:模型默认倾向是"美化"和"标准化",不是保住你那张脸的独特之处。

这段时间我一直在跑AI人像生成,也看了社区里不少人的做法。下面整理的这套方法,核心思路是把提示词(Prompt)写成一份摄影策划案,而不是一堆形容词。GPT-Image2、Nano Banana、即梦 AI、豆包Stable Diffusion、Midjourney 等等都能用。

AI写真不像本人?加这一句话,相似度直接拉到95%

一、为什么AI总把你变成别人

几个常见问题:

原图污染。AI会顺手把参考图的背景、衣服、姿势也带上,输出变成原图轻微美化版。

过度美化。训练数据里精致网红脸太多,模型自动"优化"五官、肤色、比例。

注意力分散。九宫格或者复杂场景下,AI根本顾不上单人特征。

提示太模糊。写"像本人、高级感、韩系",AI需要的是具体的摄影指导。

解决思路:把参考照片当成身份锚点,而不是让AI照搬场景。

二、第一句话决定成败

在提示词最开头加上类似这句:

"A highly detailed portrait of the exact same person in the reference photo, strictly preserve the unique facial features, bone structure, eye shape, nose, mouth, and skin texture from the reference image as identity reference only, do not copy background, clothing or pose from reference..." 中文对照:"一张高度精细的参考图本人肖像,严格保留参考图中的独特面部特征、骨骼结构、眼型、鼻子、嘴唇和皮肤纹理,仅作为身份识别参考,不要复制参考图的背景、服装或姿势……"

这句话直接告诉AI:参考图只用来认脸,其他别抄。不少人反馈,光加这一句,相似度就能从六成拉到八成以上。

三、把"像本人"拆成具体特征

别只写"像本人"或"保留原貌",太模糊了。换成可执行的描述:

面部特征:骨骼结构、眼距、鼻翼宽度、唇形、下颌线、耳朵形状

皮肤细节:肤色、痣、雀斑、细微不对称(真实人脸本来就不完全对称)

眼睛和眉毛:眼睛颜色、瞳孔细节、眉形

负面提示(Negative Prompt),建议加上:

网红脸, 过度美化, 整形感, 标准化五官, 陌生人, 完美对称, 塑料皮肤, 蜡像感

另外,多角度参考图(正面、侧面、3/4侧脸)配合 ControlNet 的 OpenPose 和 IP-Adapter-FaceID,能进一步锁定特征。权重方面,用 (exact likeness:1.3) 之类的语法加强。

四、发型、妆容和记忆点

发型:按长度、刘海、发色分层描述。比如:

英文:"long dark brown hair with natural air bangs following the reference, soft layers, not stiff template hairstyle"

中文:"深棕色长发,参考原图的自然空气刘海,柔和层次感,不要生硬的模板发型"

在原图基础上做写真级优化——加层次和光泽,避免死黑。

妆容:少女风或韩系风可以这样写:

英文:"natural makeup with subtle blush on cheeks, glossy but not heavy lips, fresh girl-next-door look"

中文:"自然妆容,脸颊微微泛粉,唇部水润但不厚重,清新邻家女孩感"

记忆点:服装、道具、头饰等视觉锚点具体描述,同时标注 "creative reinterpretation, not direct copy",既避免泛化又能提升辨识度。

五、姿势、表情和眼神:制造抓拍感

AI默认爱用45度微笑加正中构图。得主动对抗这种惰性。

眼神流向:写清楚

• looking at camera(直视镜头)

• gazing at partner(注视对方)

• soft side glance(柔和侧视)

• laughing with eyes closed(笑到眯眼)

情侣照尤其要注意主次关系和情绪互动。

表情与角度:混合使用

• candid moment(抓拍瞬间)

• spontaneous smile(自然微笑)

• slight head tilt(微微偏头)

多角度穿插正面、3/4侧、侧面。

姿势规划:提前列个镜头表——正面半身、背后环抱、手部特写,不让AI偷懒重复。

身体比例:单独约束一句

英文:"perfect anatomy, correct hand structure, natural proportions, no distortion in close contact"

中文:"人体结构正确,手部细节正确,比例自然,近距离接触无变形"

复杂互动比如贴脸、牵手时,明确左右前后和身体归属。比如:

英文:"female on the left, her left hand on his shoulder..."

中文:"女生在左侧,她的左手搭在他肩膀上……"

六、生成策略:单张迭代比批量强

推荐流程:单张生成6-9次,挑最好的,再拼九宫格。批量出九宫格容易脸不一致、质量参差不齐。

后期校正:用 Inpainting 修局部,或者做"主角校正"——重新上传原图微调。

进阶工具:

Stable Diffusion 用户可以用本人20多张多角度照片训练专属 LoRA,相似度能到95%以上。ReActor 和 FaceID 也值得试试。

摄影术语能强化真实感:

英文:"shot on Canon EOS R5, 85mm f/1.8, natural light, film grain, editorial photography"

中文:"佳能 EOS R5 拍摄,85mm f/1.8 镜头,自然光,胶片颗粒感,杂志摄影风格"

七、Prompt 模板(最小可用版)

英文:
[身份参考句] + detailed description of the person strictly following reference facial features: [具体五官/发型/妆容], [场景与风格], [姿势/表情/眼神具体描述], [摄影参数: lighting, camera, mood], highly detailed, photorealistic...

Negative: deformed, blurry, bad anatomy, extra limbs, ugly, plastic skin, over-smoothed, celebrity-like, not the reference person...

---

中文:
[身份参考句] + 严格参照参考图人物面部特征的人物详细描述:[具体五官/发型/妆容], [场景与风格], [姿势/表情/眼神具体描述], [摄影参数:光线、相机、氛围], 高度精细,照片级真实感……

负面提示:变形、模糊、人体结构错误、多余肢体、丑陋、塑料皮肤、过度磨皮、明星脸、与参考人物不符……

根据主题——鬼马少女、韩系情侣、旅行九宫格等——往里面填内容。好模板的本质就是一份摄影策划:控制身份、风格、构图、瞬间、关系。

八、几个补充建议

经常用本人出图的话,花时间训一个 LoRA 是回报率最高的投入。20多张高质量多角度照片就能起步。

光影方面,强调自然光、轻微颗粒感、环境互动,避免过度光滑的塑料质感。

测试的时候从小改动开始,逐步加元素,别一口气塞太多。

避开纯自拍参考(比例容易崩);复杂动作多靠 ControlNet;生成后如果脸部还有偏差,Face Swap 工具可以微调。

多跑、多对比、多迭代,模板会越用越顺手。