Система корректно синхронизирует движения губ, меняет пропорции тела и даже имитирует взаимодействие с предметами.
Компания ByteDance, владеющая TikTok, представила OmniHuman‑1 — новую систему искусственного интеллекта, способную создавать гиперреалистичные дипфейки. По словам разработчиков, технология позволяет генерировать видео любой длины на основе одного изображения и аудиофайла, будь то речь или песня.
В отличие от большинства аналогов, OmniHuman‑1 практически не выдаёт себя. Система корректно синхронизирует движения губ, меняет пропорции тела и даже имитирует взаимодействие с предметами. Алгоритм обучен на 19 000 часах видеоконтента из нераскрытых источников, а в основе модели лежит генератор SeaWeed, ранее разработанный ByteDance.
Несмотря на впечатляющие возможности, у OmniHuman‑1 есть ограничения. Например, технология хуже работает с низкокачественными снимками и сложными позами.
Эксперты опасаются, что развитие таких технологий усилит волну дезинформации и мошенничества. В 2023 году злоумышленники использовали дипфейки для кражи 12 миллиардов долларов, а к 2027 году ущерб может достигнуть 40 миллиардов. В ответ на угрозу ряд стран уже начал разрабатывать законодательные меры по борьбе с поддельными видео.
Обложка: Kyle Wiggers / YouTube