Специалисты НГТУ разработали первое в России ПО для автономного создания аудиоконтента на основе нейросетей. Система генерирует музыку, вокал и звуковые эффекты по текстовому описанию — без облачных сервисов и зависимости от зарубежных платформ, пишет ТАСС.
Программа работает на обычном оборудовании с видеопамятью менее 6 ГБ, поддерживает русскоязычные запросы и экспорт в WAV, MP3, FLAC. Для точности генерации модель дообучена под три типа контента: инструментал, песни и звуковые эффекты. Качество оценили на 4,1 из 5 баллов — на уровне ведущих коммерческих аналогов.
Встроенный интерфейс позволяет управлять проектами, сохранять пресеты и экспортировать треки без сторонних редакторов. В планах — поддержка пространственного аудио для VR, интеграция с MIDI-контроллерами и адаптация под озвучку игр, подкастов и рекламы.
Ранее АиФ-Новосибирск писал, что новосибирские учёные упростили разработку новых самолётов.