Новосибирские магистранты разработали сервис для создания каверов песен

Новосибирские магистранты разработали сервис для создания каверов песен

В Новосибирском государственном техническом университете НЭТИ придумали десктопное приложение AI Covers, помогающее пользователям создавать собственные модели певческого голоса.

Лариса Сокольникова

В пресс-службе вуза сообщили, что магистранты факультета автоматики и вычислительной техники Михаил Киреенко и Данил Матвеев под руководством преподавателя кафедры автоматизированных систем управления Егора Антонянца сделали приложение для автоматизированного создания песен. В новой программе модель ИИ воспроизводит заданный голос.

По словам Егора Антонянца, существующие решения для генерации кавер-версий музыкальных композиций, как правило, оказываются фрагментированными.

«Приходится использовать несколько разных сервисов, а возможности кастомизации остаются ограниченными. Именно эта проблема подтолкнула команду программистов к разработке собственного комплексного приложения, объединяющего весь цикл создания AI-каверов в едином интерфейсе», — пояснил наставник.

AI Covers позволяет автоматизировать процесс. Эта программа сочетает несколько модулей, каждый из которых решает важную задачу. Первый отвечает за разделение аудио на вокал и инструментальные партии. Второй преобразует голос с помощью нейронной сети, что позволяет достигать высокой точности передачи тембра и интонации.

Третий модуль совмещает обработанный вокал с минусовкой и другими компонентами трека.

Четвёртый модуль, который отличает приложение от его аналогов, даёт пользователям возможность задавать свои голосовые модели. Это превращает сервис в инструмент персонализированного музыкального творчества.

«ИИ анализирует исходный вокал и воссоздаёт его с помощью различных голосовых моделей. Пользователь может не только работать с готовыми моделями, но и обучать систему на основе собственного голоса», — отмечает Егор Антонянц.

По его мнению, этот функционал открывает новые перспективы для любителей музыки. Они смогут генерировать уникальные вокальные партии или использовать технологии в образовательных целях.

Приложение почти готово. Оно станет доступным для всех желающих, как только разработчики обеспечат поддержку большего количества форматов, добавят функции тонкой настройки аудио и запустят онлайн-версию сервиса.

Ранее в НЭТИ приступили к разработке принципиально нового программного обеспечения, которое позволит трансформировать голосовые записи в печатный текст.

Выбор редакции