Промт для face swap в Nano Banana: рабочая структура и готовые шаблоны

Рабочий промт для замены лица в Nano Banana собирается из пяти блоков: роли Image 1 / Image 2, перечисление черт лица, описание изменения, ограничители, дублирование инструкции сохранения лица в конце. Дублирование критично: одиночное упоминание модель часто игнорирует. Ниже три шаблона под разные сценарии, включая подготовку кадра к анимации в Wan 2.2 Animate, и разбор каждой строки. Материал проверен на Gemini 2.5 Flash в Google AI Studio.

Почему Nano Banana меняет лицо, даже если вы просите его сохранить

Любая правка картинки для модели – это разрешение трогать всё изображение, если в тексте промта нет явных ограничителей. Фраза «сохрани лицо» без перечисления конкретных черт работает как просьба общего характера и легко проигрывает любой другой инструкции в том же промте.

В комментариях под разборами Nano Banana пользователи описывают одно и то же: «лица всё ещё очень сильно меняет, как ни задавай требование сохранить черты», «вклеивает референс как будто он из бумаги вырезан». Причина одинаковая. В промте нет ни перечня черт, ни жёсткой привязки лица к конкретному файлу референса.

Второй фактор – масштаб. Если человек на исходном фото расположен мелко (общий план, ростовой кадр), сетка чаще переписывает лицо даже при просьбе изменить только одежду. Для лица как ключевого объекта нужен крупный план, иначе никакая магическая формула не поможет.

Side-by-side comparison of two AI-generated portraits showing the same woman placed into a coffee-shop scene, the left labeled 'short prompt' with a noticeably altered face that looks pasted on, the right labeled 'detailed prompt' with the original facial features preserved, shot at eye level against a warm window-lit cafe background, soft directional daylight from the right with gentle shadow on the cheekbone, photorealistic editorial mood with crisp detail on the eyes and skin texture.

Что подготовить до написания промта

До открытия Google AI Studio имеет смысл собрать минимальный набор. Без него любой промт ломается уже на загрузке файлов.

  • Два изображения: исходная сцена с человеком и отдельное фото лица / персонажа для подстановки.
  • Аккаунт Google для входа в aistudio.google.com.
  • Из России – зарубежный прокси и смена IP в браузере, для Nano Banana Pro подписка Google AI Plus, Pro или Ultra.
  • Фото лица крупным планом, нейтральное освещение, взгляд в камеру – без этого черты сохранять нечем.
  • Понимание порядка загрузки: финальный кадр часто наследует соотношение сторон последнего загруженного файла, поэтому фото сцены имеет смысл грузить последним.

Лимиты тоже стоит проверить заранее. Базовая Nano Banana даёт около 100 генераций в сутки, Nano Banana 2 в районе 20–50, Nano Banana Pro от 50 до 1000 в зависимости от подписки, для бесплатных аккаунтов остаются 2–3 пробные генерации в день. Цифры публиковались в обзоре postium.ru и могут меняться, перед серией запусков актуальные значения лучше сверить.

Структура рабочего промта: разбор по блокам

Промт для face swap делится на пять блоков. Каждый из них отвечает за свой риск: путаницу референсов, потерю черт, неверный фон, копирование лишнего, забывание главной инструкции к финалу.

Блок 1. Роли изображений

Прямо в тексте промта пишется, что взять из какого файла: «из Image 1 взять лицо, из Image 2 взять сцену, фон и позу». Без этой строки модель сама решает, чьё лицо переносить, и легко берёт его не из того кадра.

Блок 2. Фиксация черт лица в начале

Перечисляются конкретные черты: разрез глаз, форма носа, губы, овал лица, брови, подбородок, форма скул. Этот список и есть та самая «магическая формула», которую vibehype.ru разбирает на конкретных примерах: абстрактное «сохрани лицо» проигрывает явному перечню всегда.

Блок 3. Описание изменения

Дальше идёт, что именно заменяется и что остаётся: персонаж в сцене меняется, фон, освещение, масштаб и поза из Image 2 сохраняются. Эпитеты «красивый», «стильный» здесь бесполезны, нужны конкретные параметры: цвет, материал, тип света, ракурс.

Блок 4. Ограничители

Отдельной строкой прописывается, чего быть не должно: «людей из Image 1 не копировать целиком, только лицо», «позу из референса лица не переносить», «фон не менять». Без негативных рамок модель добирает лишние детали по своему усмотрению.

Блок 5. Дублирование в конце

Финал промта повторяет ключевую инструкцию: «Сохрани лицо абсолютно идентичным оригиналу из Image 1». Модель обрабатывает длинный текст с разным весом, и инструкция, стоящая в конце, дополнительно поднимает приоритет лица. Одиночное упоминание в середине промта почти всегда проигрывает паре в начале и в конце.

Готовые шаблоны промтов: скопировать и вставить

Три шаблона ниже покрывают типовые сценарии: чистая замена лица с сохранением фона, замена всего персонажа на английском (Google AI Studio лучше принимает английский для swap-задач), подготовка кадра к анимации через Wan 2.2 Animate.

Шаблон 1. Замена лица с сохранением фона

Точно сохрани на 100% схожесть лица из Image 1: разрез глаз, форму носа, губы, овал лица, брови, подбородок, форму скул. Помести это лицо в сцену из Image 2. Сохрани фон, освещение, масштаб и позу из Image 2 без изменений. Людей из Image 1 не копировать целиком, только лицо. Сохрани лицо абсолютно идентичным оригиналу из Image 1.

Если убрать первую строку с перечнем черт, лицо «плывёт». Если убрать ограничитель про Image 1, модель тащит из референса целиком фигуру и позу. Если убрать финальную фразу, лицо чаще меняется при дальнейшем редактировании одежды.

Шаблон 2. Замена всего персонажа (английский, Google AI Studio)

Swap the person in Scene B with character A. Keep the background, and make character A look straight.

Версия проверена в материале neurotoday.ru про замену лица на видео. «Keep the background» удерживает сцену, «look straight» нужен не ради эстетики, а под следующий шаг с Wan 2.2 Animate – об этом ниже. Если этот шаблон применяется без анимации, фразу про взгляд можно убрать.

Шаблон 3. Подготовка к анимации в Wan 2.2 Animate

Тот же текст, что и в шаблоне 2, плюс акцент на нейтральной позе:

Swap the person in Scene B with character A. Keep the background, make character A look straight, neutral pose, eyes to camera.

Любое отклонение от взгляда в камеру и нейтральной позы Wan 2.2 Animate отрабатывает с искажениями мимики и плечевого пояса. На стадии Nano Banana проще получить «портрет под анимацию», чем чинить артефакты в видеомодели.

Итеративный подход: метод ступенек

Большие промты, которые пытаются разом поменять лицо, одежду и фон, проигрывают коротким итерациям почти всегда. Правило простое: 1 шаг = 1 изменение, результат каждого шага становится новым референсом для следующего.

  1. Шаг 1. Заменить лицо по шаблону 1, остальное не трогать.
  2. Шаг 2. Взять полученный кадр как Image 2, скорректировать освещение или ракурс отдельным коротким промтом.
  3. Шаг 3. На стабильном результате доработать одежду или аксессуары, упомянув только их.

Логика описана в разборе vibehype.ru: модель хуже держит сложные многозадачные запросы, разбиение на ступеньки сужает её свободу на каждом шаге. Бонус метода – если что-то поплыло, откатываться нужно на один шаг, а не переписывать весь промт.

Three vertical image panels arranged side by side showing the same woman, panel one labeled 'Step 1 face' with her original face newly transferred onto a city street scene, panel two labeled 'Step 2 light' with warmer evening light blended onto her skin, panel three labeled 'Step 3 outfit' with a navy coat added while the face stays identical, shot eye level on a quiet European street, soft golden-hour sun raking from camera left producing gentle skin highlights, clean editorial color grading.

Несколько референсов: метод коллажа

Когда нужно собрать образ из лица, одежды и фона из разных источников, плодить файлы не обязательно. Все элементы кроме лица собираются в один коллаж-изображение, и модель получает всего два файла. Это проще и для неё, и для разводки ролей в промте.

Текст промта тогда выглядит так: «из Image 1 взять лицо, из Image 2 (коллаж) взять одежду и фон, людей из коллажа не копировать, сохранить детали одежды – цвета, узоры, фасоны, текстуры. Сохрани лицо абсолютно идентичным оригиналу из Image 1». Структура та же, что в шаблоне 1, но роль Image 2 расширена.

Nano Banana Pro формально принимает до 14 изображений в одном запросе, по данным smmbot.net. На практике, чем больше файлов, тем тщательнее придётся прописывать роли. Подход «из Image 2 взять свет и зерно, из Image 3 взять фон и декор, людей из референсов не копировать» – не пожелание, а условие, без которого модель путает источники.

Типичные ошибки и как их исправить

Симптом Что не так в промте Фикс
Лицо изменилось при смене одежды Не перечислены конкретные черты лица Добавить перечень в начале и продублировать «сохрани лицо идентичным оригиналу» в конце
Артефакты, мутные детали, странные изменения Несколько изменений в одном промте Перейти на метод ступенек: 1 шаг = 1 изменение
Перепутаны лицо и поза, скопирован «не тот» человек Не указаны роли изображений Прямо в тексте написать «из Image 1 взять лицо, из Image 2 взять сцену, людей из Image 1 не копировать»
Случайный результат, не похожий на запрос Расплывчатые формулировки («красивый», «стильный») Заменить эпитеты конкретикой: цвет, материал, тип света, ракурс
Лицо «приклеено», нет органичности Не указано соответствие масштаба и освещения Добавить требования к свету, масштабу и позе под окружение Image 2
Анимация в Wan 2.2 Animate с искажениями В кадре взгляд не в камеру Добавить «make character A look straight» уже на стадии Nano Banana

Один важный нюанс по последней строке. Этическая часть face swap не отменяется удобством инструмента: лица реальных людей без их согласия лучше не подставлять никуда, тем более в материалы, которые могут уйти в публичный доступ.

Бонус: подготовка кадра под Wan 2.2 Animate

Сценарий, под который проектировался шаблон 3, собирается из четырёх шагов. Nano Banana отвечает за статичный кадр, Wan 2.2 Animate – за движение.

  1. В Google AI Studio загрузить фото сцены и фото персонажа, отправить промт «Swap the person in Scene B with character A. Keep the background, and make character A look straight».
  2. Сохранить полученный кадр с заменённым персонажем, смотрящим прямо в камеру.
  3. Открыть create.wan.video, загрузить подготовленное изображение и референсное видео с нужными движениями.
  4. Запустить генерацию и подождать.

По данным neurotoday.ru, бесплатная версия Wan 2.2 Animate выдаёт ролики до 5 секунд, генерация одного видео занимает 5–15 минут в зависимости от длительности исходника и загрузки серверов. Цифры актуальны на момент тестирования материала, перед серией запусков их стоит сверить с актуальным интерфейсом сервиса.

Если на этой стадии лицо «поплыло» (а такое бывает, даже когда статичный кадр выглядит идеально), вернуться имеет смысл к шаблону 1: пересобрать портрет с явным перечислением черт, дублированием инструкции и взглядом прямо в камеру. Это короче, чем чинить готовое видео.