Нижегородские учёные научили алгоритм определять тревогу по голосу
Разработка основана на методах машинного обучения. Алгоритм анализирует акустические особенности речи — высоту голоса, громкость, тембр и скорость произношения. Эти параметры меняются, когда человек испытывает стресс.
Как пояснила заведующая кафедрой киберпсихологии ННГУ Валерия Демарева, технология может использоваться в разных сферах. Например, она поможет выявлять перегрузку у операторов, диспетчеров или медработников, где ошибки из-за стресса могут иметь серьёзные последствия.
Также подобные системы могут быть полезны в банковской сфере. По словам исследователей, анализ эмоционального состояния клиента во время разговора способен помочь выявлять случаи мошенничества, когда человек действует под давлением или введён в заблуждение.
В пилотном исследовании участвовали десять студентов кафедры киберпсихологии. Они записывали фрагменты научной презентации в двух ситуациях — во время публичного выступления перед комиссией и во время репетиции без аудитории.
После обработки записи были разделены на короткие пятисекундные сегменты. Всего исследователи получили более тысячи отрезков речи для анализа.
Для обработки данных использовались мел-частотные кепстральные коэффициенты — распространённый метод анализа звукового сигнала. На основе этих параметров алгоритм Gradient Boosting смог различать стрессовые и спокойные фрагменты речи с точностью 91,9%.
Учёные отмечают, что такой результат получен в контролируемых условиях эксперимента. В дальнейшем исследователи планируют расширить выборку, добавить новые акустические признаки и протестировать систему на более разнообразных данных.
Работа выполняется при поддержке Российского научного фонда, а результаты исследования опубликованы на научной платформе Springer Nature Link.
Напомним, что ННГАСУ разработал программу для точного расчета систем отопления
Фото: Андрей Скворцов, пресс-служба ННГУ
