ПО полностью независимо от зарубежных платформ и может работать в закрытом контуре. Об этом сообщил ТАСС со ссылкой на руководителя проекта Егора Антонянца.
Первое в России программное обеспечение для генерации музыки и песен с применением моделей искусственного интеллекта разработали в Новосибирском государственном техническом университете НЭТИ.
По словам Егора Антонянца, система обеспечивает полный цикл создания аудиопродукта — от этапа текстового задания до экспорта в популярные форматы. При этом работает она на оборудовании с объёмом видеопамяти менее 6 ГБ.
«Мы дообучили базовую модель специализированными LoRA-адаптерами под три типа контента: инструментальную музыку, песни с вокалом и звуковые эффекты. Это позволяет избежать смешения характеристик и добиться более точного соответствия запросу», — цитирует информагентство разработчика.
По его словам, в отличие от базовых инструментов, ориентированных на англоязычных пользователей, новый адаптирован для работы с заданиями на русском.
Создатели планируют улучшить систему, интегрировать её с MIDI-контроллерами для живого взаимодействия, добавить поддержку пространственного аудио для задач виртуальной реальности, а также приспособить ПО для промышленных сценариев. Сервис позволит создавать звуковые ландшафты для видеоигр, озвучивать фильмы и прямые трансляции, подкасты и рекламные ролики.
Ранее в НГУ реализовали технологию для создания аудиоверсий научных книг.
Подписывайтесь на канал «Новосибирские новости» в МАКС .