Российские учёные создали программу, отслеживающую изменения в употреблении слов
В ведомстве отметили, что разработка учёных Мурманского арктического университета формирует своеобразное «цифровое сито», выявляя в огромных объёмах текстов, как изменяется частота употребления каждого слова с течением времени.
Метод успешно апробирован на уникальном материале — диахронических (разновременных) корпусах Национального корпуса русского языка (НКРЯ) общим объёмом более 250 миллионов слов. В ходе работы программа не просто находит слова, но также приводит их к начальной форме, фиксирует все словоформы и сравнивает частоту употребления.
Исследования, проведённые с помощью нового метода, показали, что такие слова, как псевдогаллюцинация, маслообразный, ангельчик, трансформизм и другие, бытовавшие ещё поколение назад, почти ушли из письменной речи.
С другой стороны, на высоком уровне употребления находятся слова, появившиеся после 1991 года, такие как лизинговый, офисный, инвестирование, ликвидность, внедорожник и другие.
Программа показала, что число новых слов в языке не увеличивается, а снижается, вместе с тем активный словарный запас становится больше, то есть доля часто используемых в повседневной жизни слов возрастает.
В будущем, по словам учёных, подобные подходы позволят прогнозировать языковое развитие, обучать искусственный интеллект понимать и моделировать тенденции в языке.
