BigData задача
1) выполнить описание «идеальных» данных (тип данных, ограничения,
шаблон и т.п);
2) привести варианты возможных ошибок в данных;
3) составить алгоритм повышения качества данных;
4) продемонстрировать траекторию изменения данных при использовании
разработанного алгоритма;
5) составить рекомендации, позволяющие получать исходный набор
данных с более высоким качеством.
Технология проведения
В качестве исходных данных берется любой набор из открытых
источников (в формате xls/xlsx (количество записей должно быть более 50,
атрибутов более 10). Если качество данных набора очень высокое, то
искусственно «ухудшает» его.
Стоимость договорная