Gemini Omni 让参考素材变得更重要,而不是更随意。当工作流可以同时接收图片、视频和音频线索时,提示词必须告诉模型:哪些是锚点,哪些可以改变。
写清楚视觉契约
列出必须保留的细节。产品可能是轮廓、标签、颜色、材质、比例和 Logo 位置;人物可能是脸型、发型、服装、姿态和表情范围。
把外观和动作分开
参考素材负责定义外观,提示词负责定义动作。第一版不要同时要求换服装、换背景、快速运镜、表情变化和产品旋转,否则很难判断哪里出了问题。
使用上传图片作为身份锚点。保持脸型、发型、服装和主要轮廓。只添加一个克制动作:人物缓慢转向窗边光线。背景保持简单。评审:人物是否仍然可识别且适合该语境?总结
Gemini Omni 的参考一致性来自清晰契约:保留锚点、只移动一件事、审核漂移,再只改一个变量。

