Создатели TikTok выпустили "самый реалистичный" генератор дипфейк-видео
Для создания дипфейка нейросети достаточно одной фотографии и записи голоса.

Компания ByteDance, владелец TikTok, выпустила проект под названием OmniHuman-1. Это генератор deepfake-видео, который умеет "оживлять" изображения и синхронизировать видео с загруженным аудио, передает unian.net
В TechCrunch подчеркивают, что генерируемые OmniHuman-1 дипфейки получаются "пожалуй, самыми реалистичными" среди конкурентов. Они не ограничены по продолжительности, а в качестве основы можно использовать любой снимок, даже черно-белый.
Для создания дипфейка ИИ-модели достаточно одной фотографии и записи голоса. У пользователей есть доступ к нескольким настройкам, включая соотношение сторон и "пропорции тела" субъекта. А еще можно добавить взаимодействие с посторонними предметами на фото, если они имеются.
Исследователи Bytedance говорят, что они обучили OmniHuman-1 примерно на 18 700 часах видеоданных с использованием нового подхода "omni-conditions", который позволяет этой ИИ-модели обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
В качестве примера разработчики продемонстрировали сгенерированную лекцию Альберта Эйнштейна. У OmniHuman-1 есть бесплатная демоверсия. Правда, прямо сейчас она не работает.