Letra D
KDD (extração do conhecimento)
Conceitos:
“é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados.“ (FAYYAD, 1996).
“é um processo não trivial de identificação de novos padrões válidos, úteis e compreensíveis.”
___________________
Fases do KDD:
(1) Seleção de dados: seleciona um conjunto de dados para serem ANALISADOS (estruturados, semi-estruturados, não-estruturados)
(2) Pré-processamento (limpeza): eliminar ruídos, tuplas vazias, corrigir ou remover dados inconsistentes, identificar anomalias (outliers).
(3) Transformação dos dados: transformação dos dados utilizando métodos como: Normalização, Agregação, Criação de novos atributos, e Sintetização dos dados.
(4) Mineração de dados (data mining): é a fase MAIS importante do processo de KDD. Aplicam-se técnicas para extrair informações a partir de um grande volume de dados e transforma essas informações em conhecimento útil.
(5) Interpretação / Avaliação: interpreta e avalia os padrões extraídos na etapa de Mineração de dados. (podendo retornar a qualquer fase anterior caso seja necessário)