В Новосибирском государственном университете запустили сервис, который с помощью нейросети создает аудиоверсии для текстов книг. Об этом сообщили в пресс-службе НГУ. Пока проект работает в тестовом режиме — озвучивают книги университетского издательства и те, что уже есть в электронной библиотеке и имеют разрешение от авторов, это около семи тысяч изданий.
Как объяснил ведущий научный сотрудник Центра искусственного интеллекта НГУ Евгений Павловский, нейросеть извлекает текст из PDF, обрабатывает его и создает звуковой файл. На одну книгу уходит около получаса работы 16-ядерного процессора — видеокарта не нужна. При этом разработчики не ставят цель заменить чтение, а предлагают альтернативный способ знакомства с книгой. Художественной озвучки не будет — это скорее техническое озвучивание текста.
Сервис работает на базе собственного фреймворка «Каппа». Он помогает проверять качество работы нейросетей и снижать риск ошибок. Первые сто книг уже озвучили, сейчас собирают отзывы библиотеки и читателей. Если проба пройдет удачно, технологию предложат другим университетам и публичным библиотекам. На озвучивание всего фонда уйдет около месяца, но с учетом подготовки и проверки процесс может занять до года.