A Mineração de Dados possui Técnicas e Tarefas para a Descoberta de Conhecimento(KDD), segundo Fayyad são 5 (cinco):
1) Seleção dos dados (coleta em várias bases de dados: banco de dados, planilhas excel, DWarehousing,..);
2) Preprocessamento (limpeza dos dados / preenchimentos de dados ausentes,.., remoção de DADOS (ex: outliers,..);
3) Transformação (criação de novas variáveis, remoção de variáveis não influentes, ...)
4) Mineração nos dados (aplicação das ferramenta/algoritmos que vão detectar padrões nos dados,..)
5) Interpretação e assimilação do conhecimento (resultados)
Portanto a remoção de dados é apenas uma etapa do preprocessamento, nunca o OBJETIVO da Mineração de dados.
“KDD (Knowledge-Discovery in Databases) é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados” (FAYYAD et al., 1996).
Objetivos da mineração de dados - P.I.C.O
Previsão - prever comportamentos futuros;
Identificação - identicar a existencia de um item, evento ou atividade;
Classificação - dividir os dados em classes/categorias;
Otimização - otimizar o uso de recursos limitados.
Mineração de dados NÃO remove dados.