theme-icon
logo
logo
Menu icon
Point.md logo
Поделиться новостью
Скопировать ссылку
Ссылка скопирована
21 Февраля 2024, 17:52
4 563
Скопировать ссылку
Ссылка скопирована

ElevenLabs: Создана нейросеть для генерации фоновых звуков по текстовым подсказкам

Технологический стартап ElevenLabs запустил программу на основе искусственного интеллекта (ИИ) для автоматического создания звуков окружения на основе текстовых подсказок.

Создана нейросеть для генерации фоновых звуков по текстовым подсказкам.
Создана нейросеть для генерации фоновых звуков по текстовым подсказкам.

Об этом сообщается на официальной странице компании в социальной сети X (ранее — Twitter). Авторы новой нейросети продемонстрировали ее возможности на примере беззвучных видеороликов, сгенерированных с помощью генеративной модели Sora фирмы OpenAI, передает gazeta.ru

«Мы использовали текстовые подсказки, такие как «грохот волн», «звон металла», «чириканье птиц» и «двигатель гоночного автомобиля», для создания звука, который мы наложили на некоторые из наших любимых клипов из анонса OpenAI Sora», — отметили в ElevenLabs.  

В демонстрационном видео показаны и другие примеры работы алгоритма, включая шум улицы мегаполиса, механический гул робота и лай щенков. 

ElevenLabs известна как разработчик ИИ-системы по преобразованию текста в синтезированную речь и автоматического дубляжа видео с поддержкой более чем 20 языков.

Источник
Поделиться новостью
Скопировать ссылку
Ссылка скопирована