Новосибирские магистранты разработали сервис для создания каверов песен
В Новосибирском государственном техническом университете НЭТИ придумали десктопное приложение AI Covers, помогающее пользователям создавать собственные модели певческого голоса.
Лариса Сокольникова
В пресс-службе вуза сообщили, что магистранты факультета автоматики и вычислительной техники Михаил Киреенко и Данил Матвеев под руководством преподавателя кафедры автоматизированных систем управления Егора Антонянца сделали приложение для автоматизированного создания песен. В новой программе модель ИИ воспроизводит заданный голос.
По словам Егора Антонянца, существующие решения для генерации кавер-версий музыкальных композиций, как правило, оказываются фрагментированными.
«Приходится использовать несколько разных сервисов, а возможности кастомизации остаются ограниченными. Именно эта проблема подтолкнула команду программистов к разработке собственного комплексного приложения, объединяющего весь цикл создания AI-каверов в едином интерфейсе», — пояснил наставник.
AI Covers позволяет автоматизировать процесс. Эта программа сочетает несколько модулей, каждый из которых решает важную задачу. Первый отвечает за разделение аудио на вокал и инструментальные партии. Второй преобразует голос с помощью нейронной сети, что позволяет достигать высокой точности передачи тембра и интонации.
Третий модуль совмещает обработанный вокал с минусовкой и другими компонентами трека.
Четвёртый модуль, который отличает приложение от его аналогов, даёт пользователям возможность задавать свои голосовые модели. Это превращает сервис в инструмент персонализированного музыкального творчества.
«ИИ анализирует исходный вокал и воссоздаёт его с помощью различных голосовых моделей. Пользователь может не только работать с готовыми моделями, но и обучать систему на основе собственного голоса», — отмечает Егор Антонянц.
По его мнению, этот функционал открывает новые перспективы для любителей музыки. Они смогут генерировать уникальные вокальные партии или использовать технологии в образовательных целях.
Приложение почти готово. Оно станет доступным для всех желающих, как только разработчики обеспечат поддержку большего количества форматов, добавят функции тонкой настройки аудио и запустят онлайн-версию сервиса.
Ранее в НЭТИ приступили к разработке принципиально нового программного обеспечения, которое позволит трансформировать голосовые записи в печатный текст.