Конкурент CatBoost, XGBoost, LightGBM: Яндекс представил новую нейросетевую архитектуру TabM для работы с таблицами
Лаборатория исследований искусственного интеллекта Yandex Research представила новую нейросетевую архитектуру для работы с табличными данными — TabM. Она позволяет быстро обрабатывать большие массивы данных и строить высокоточные прогнозы, что востребовано в бизнесе, исследованиях и медицине.
Разработку использовали на Kaggle — платформе для международных соревнований по анализу данных и машинному обучению от Google. В частности, новую архитектуру применяли для предсказания выживаемости пациентов после трансплантации костного мозга.
TabM (от англ. Tabular DL model that makes Multiple predictions) — это реализация так называемого ансамбля моделей, когда каждая модель проводит свой анализ, после чего прогноз усредняется. В Яндексе рассказали:
По результатам тестирования на 46 наборах данных TabM превзошла другие решения не только по занимаемому в среднем месту (1,7 у TabM против 2,9 у ближайшего конкурента), но и по стабильности работы, что важно …
