23.12.2024

Новый ИИ от Google позволяет создавать одни изображения из других — без помощи текста

Можно загрузить три картинки и объединить их в одну.

Новый ИИ от Google позволяет создавать одни изображения из других — без помощи текста

Google запустила новый инструмент под названием Whisk, который позволяет создавать изображения с использованием других изображений в качестве подсказок, вместо традиционных текстовых описаний.

Новый ИИ от Google позволяет создавать одни изображения из других — без помощи текста

Через Whisk можно загрузить картинки для каждого из трёх параметров: объект, сцена и стиль. Есть возможность комбинировать несколько картинок для каждой категории. При необходимости можно добавить текстовое описание для уточнения результата, но это не обязательное условие. Если подходящих изображений под рукой нет, можно воспользоваться кнопкой с кубиком, чтобы Google автоматически подобрал варианты — правда, они тоже генерируются ИИ.

После обработки запроса Whisk создаст изображение и текстовый промпт, соответствующий результату. Пользователи могут сохранить итоговый вариант, добавить детали через текстовое поле или отредактировать изначальный запрос для улучшения изображения.

Инструмент базируется на последней версии модели генерации изображений Imagen 3. Компания подчёркивает, что Whisk предназначен для «быстрого визуального исследования», а не для точной обработки картинок. Google также предупреждает, что инструмент может не всегда идеально попадать в задуманный результат, поэтому предусмотрена возможность редактирования. Пока новый ИИ доступен только в США.

Обложка: Google