Депрессию можно услышать: как нейросеть ставит диагноз по голосу

Ученые НГУ создали нейросеть для диагностики депрессии по голосу с точностью 94%

Фото: istockphoto.com/Yurii Yarema

Ученые из Новосибирского государственного университета (НГУ) представили первую в России цифровую систему, способную оценивать уровень депрессии по звучанию человеческого голоса. Об этом сообщили в пресс-службе университета.

Разработка носит название NeuroVoice и призвана стать помощником для врачей в сложной диагностике этого распространенного расстройства.

Депрессия остается одной из глобальных проблем здравоохранения. По данным Всемирной организации здравоохранения, в 2025 году ей страдали около 332 млн человек по всему миру. Часто болезнь протекает скрыто: пациенты жалуются на необъяснимые боли, проблемы с сердцем или пищеварением, а истинная психическая причина остается незамеченной. Терапевтам, к которым обычно обращаются с такими симптомами, не всегда хватает времени и узкой специализации для углубленного анализа.

Новая технология предлагает решение через анализ объективных данных — акустических характеристик речи.

«Диагностика по голосу имеет ключевое преимущество: она исключает фактор социальной желательности, когда человек может сознательно или бессознательно искажать информацию в опросниках. Контролировать тон, темп и энергетику голоса с целью скрыть симптомы практически невозможно», — поясняет руководитель проекта, кандидат психологических наук, старший преподаватель кафедры психологии личности НГУ Марина Злобина.

В основе системы лежит современная нейросетевая архитектура wav2vec. Исследователи обучили ее на более чем 90 интервью, каждое из которых было оценено с помощью стандартного опросника PHQ-9. В результате модель научилась классифицировать речь по четырем уровням выраженности депрессии — от полного отсутствия симптомов до тяжелой формы.

«Обученная модель показывает высокую точность, сопоставимую с лучшими зарубежными аналогами. Комплексный показатель F1, объединяющий точность и полноту распознавания, превышает значение 0.94, — рассказывает кандидат психологических наук, заведующий кафедрой клинической психологии НГУ Александр Федоров. — Для удобства использования мы создали прототип приложения с графическим интерфейсом. Оно позволяет как анализировать готовые аудиозаписи, так и проводить оценку в реальном времени».

Важно подчеркнуть, что технология не заменяет специалиста-психиатра. Ее цель — стать эффективным скрининговым инструментом для врачей общей практики.

«NeuroVoice поможет выявлять так называемую маскированную депрессию, которая проявляется физическими недомоганиями без явной соматической причины, а также депрессию, сопутствующую другим заболеваниям», — уточняет Марина Злобина.

Разработка велась в течение четырех месяцев — с сентября по декабрь 2025 года — при поддержке программы «Приоритет-2030». В команду вошли как опытные ученые, так и студенты-психологи НГУ.

Планы у исследователей масштабные: расширение базы данных русскоязычных речевых образцов, дообучение модели и интеграция ее в финальную версию приложения. В перспективе аналогичный подход можно будет адаптировать для диагностики других психических расстройств, а также добавить анализ мимики по видео, что сделает оценку еще более комплексной.

Ранее сообщалось, кормление ребенка «под мультики».