Column target corresponds to target variable in train.csv
Есть два агента, которые взаимодействуют друг с другом, в результате чего каждый агент либо получает выигрыш (yi = 1), либо нет (yi = 0). Таргет в данной задаче = (y1 >= 1 & y2 >= 1)
Для тренировочной выборки известно некое матожидание выигрыша агента, рассчитанное на основании их взаимодействия с другим агентом - т.е. насколько вероятно, что после их взаимодействия агент i получил бы выигрыш (train_expected_target_agent_1.csv и train_expected_target_agent_2.csv)
Возможно имеет смысл строить отдельную модель для предсказания таргета под каждого агента по отдельности, а затем просто делать конъюнкцию предсказаний моделей (реальный таргет имеет схожую зависимость). Для этого есть train_target_agent_1.csv и train_target_agent_2.csv
======= Для чего это нужно =======
Можно поэкспериментировать с удалением выбросов из тренировочной выборки - н-р, если expected_target был близок к 1 у обоих агентов, а реальный таргет = 0, скорее всего, это зашумленное наблюдение, которое может негативно повлиять на качество сети.
Аналогично (и это даже не можно, а нужно) поэкспериментировать с удалением бесполезных признаков. У вас их по 117 на каждого агента (в сумме 234), а примеров в трейне чуть больше двух тысяч - есть несколько способов проверить, насколько важен признак для обучения, рекомендую хотя бы одним воспользоваться.
Last but not least - у вас таргет зависит от признаков первого агента и признаков второго агента - можно поэкспериментировать с сиамскими сетями (когда один и тот же экстрактор признаков для обоих агентов, "полученные признаки" обоих агентов конкатенируются, дальше обрабатывается совместно и получаем итоговый результат).
Итог: нужно преодолеть hard baseline
You can only use neural networks / linear / nearest neighbors models for this task - tree-based models are forbidden!
103news.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.
Сергей Собянин: фонд музея "Царицыно" собрал 61 тыс. произведений искусства
103news.com — международная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.
Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).
103news.com — живые новости в прямом эфире!
В любую минуту Вы можете добавить свою новость мгновенно — здесь.