Сервис для создания аудиоверсий научных книг разработали в НГУ
Программу придумали, чтобы упростить озвучивание огромной библиотеки из семи тысяч изданий.
Новосибирские новости
Исследовательский центр искусственного интеллекта НГУ разработал технологию по автоматическому созданию аудиоверсий книг. Сейчас она проходит этап апробации. В аудиоформат переведут уже оцифрованную литературу университетского издательства и материалы, размещённые в электронной библиотеке, с разрешения правообладателей.
Нейросеть извлекает текст из PDF, проводит его предварительную обработку и формирует звуковую версию. По словам ведущего научного сотрудника центра ИИ Евгения Павловского, сервис не предполагает полной замены традиционного чтения. Это альтернативная форма доступа, дополнительный способ работы с книгой.
«Для массового использования важно, что решение не является ресурсоёмким: на одну книгу уходит примерно полчаса процессорного времени, причём речь о 16-ядерном процессоре, даже без видеокарты», — пояснил разработчик.
Сервис создан на базе платформы «Каппа», придуманной для управления датасетами и моделями искусственного интеллекта. Она тестирует их перед внедрением, проверяя корректность работы и снижая риск так называемых «галлюцинаций». В новом проекте «Каппа» готовит обучающие данные для озвучки и сбора обратной связи о качестве результата.
В пилотном режиме уже наделили голосом первые 100 книг, сейчас команда ожидает отклика от пользователей. В дальнейшем изобретение хотят предложить другим университетам и публичным библиотекам через партнёрскую платформу или в иных форматах.
По оценке учёных, весь фонд можно озвучить за месяц, однако на верификацию результатов потребуется около года.
Умные разработки НГУ протестируют в городском хозяйстве. Об этом заявил мэр Кудрявцев в ходе февральского визита в Академгородок.