Новый ИИ от Google позволяет создавать одни изображения из других — без помощи текста

Можно загрузить три картинки и объединить их в одну.

Google запустила новый инструмент под названием Whisk, который позволяет создавать изображения с использованием других изображений в качестве подсказок, вместо традиционных текстовых описаний.

Через Whisk можно загрузить картинки для каждого из трёх параметров: объект, сцена и стиль. Есть возможность комбинировать несколько картинок для каждой категории. При необходимости можно добавить текстовое описание для уточнения результата, но это не обязательное условие. Если подходящих изображений под рукой нет, можно воспользоваться кнопкой с кубиком, чтобы Google автоматически подобрал варианты — правда, они тоже генерируются ИИ.

После обработки запроса Whisk создаст изображение и текстовый промпт, соответствующий результату. Пользователи могут сохранить итоговый вариант, добавить детали через текстовое поле или отредактировать изначальный запрос для улучшения изображения.

Инструмент базируется на последней версии модели генерации изображений Imagen 3. Компания подчёркивает, что Whisk предназначен для «быстрого визуального исследования», а не для точной обработки картинок. Google также предупреждает, что инструмент может не всегда идеально попадать в задуманный результат, поэтому предусмотрена возможность редактирования. Пока новый ИИ доступен только в США.

Обложка: Google

inttro

Вам также может понравиться

Linkedin – Revit LT 2025 Essential Training

На Титане есть реки, но у них нет дельт — и учёные не знают, почему

[Кымбат Масакбаева] Я в кадре. Практический интенсив по мобильной видеосъемке (2024)