Разработка Data Mining-продуктов
- методы классификации,
- методы моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики
- статистические методы (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов, анализ выживаемости, анализ связей
Применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой.
Задачи, решаемые методами data mining, принято разделять на описательные (англ. descriptive) и предсказательные
В описательных задачах самое главное — это дать наглядное описание имеющихся скрытых закономерностей, в то время как в предсказательных задачах на первом плане стоит вопрос о предсказании для тех случаев, для которых данных ещё нет.
К описательным задачам относятся:
- поиск ассоциативных правил или паттернов (образцов);
- группировка объектов, кластерный анализ;
- построение регрессионной модели.
- классификация объектов (для заранее заданных классов);
- регрессионный анализ, анализ временны́х рядов.