-
Primeiramente faz-se necessário conhecer a sequência das etapas do KDD, que segundo Fayyad (et. al., 1996b) são:
Seleção, pré-processamento, transformação, data mining e interpretação/avaliação
Assim .Assim sendo, tem-se:
Opção A - correta (a sequência e os nomes estão corretos)
Opção B - incorreta (sequência errada)
Opção C - incorreta (não contempla as etapas)
Opção D - incorreta (não contempla as etapas)
Opção E - incorreta (não contempla as etapas)
E, em tempo:
"O processo KDD é constituído de várias etapas [...] que são executadas de forma interativa e iterativa. De acordo com Brachman & Anand (1996), as etapas são interativas porque envolvem a cooperação da pessoa responsável pela análise de dados, cujo conhecimento sobre o domínio orientará a execução do processo. Por sua vez, a iteração deve-se ao fato de que, com freqüência, esse processo não é executado de forma seqüencial, mas envolve repetidas seleções de parâmetros e conjunto de dados, aplicações das técnicas de Data Mining e posterior análise dos resultados obtidos, a fim de refinar os conhecimentos extraídos." (Fonte: http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf, acesso em 21/06/2012).
-
De acordo com Figueira (1998), podem se dividir as etapas da KDD da seguinte forma
Seleção: é a etapa de agrupamento(organizado) dos dados Pré-processamento: neste momento os dados passam por uma adequação. Ao final do processo, devem possuir o formato correto e não apresentar duplicidade, entrer outras características; Transformação: é a etapa de armazenamento dos dados de forma a facilitar o usi das técnicas de Data Mining; Data Mining: é a principal atividade do conhecimento, aplicando, para este fim, algoritmos de descoberta de padrões; Interpretação e avaliação: como o nome diz, esta fase consiste em interpretar os dados gerados e verificar se possuem alguma validade para o problema proposto.
https://sites.google.com/site/mineracaodedados1b/descoberta-do-conhecimento-kdd
-
RESPOSTA LETRA A
"O processo de busca de conhecimento contém uma série de passos: seleção, pré-processamento e limpeza, transformação, mineração de dados (data mining) e interpretação/avaliação. Simplificando, pode-se dizer que o processo de KDD compreende, na verdade, todo o ciclo que o dado percorre a té virar informação, conforme pode ser visto na figura."
http://fp2.com.br/blog/wp-content/uploads/2012/08/kdd.png
http://fp2.com.br/blog/index.php/2012/um-visao-geral-sobre-fases-kdd/
-
Letra A
Apenas para complementar... na visão de Navathe:
O processo de Knowledge Discovery in Database (KDD) ou descoberta de conhecimento em banco de dados compreende seis fases:
- Seleção de dados.
- Limpeza de dados.
- Enriquecimento.
- Transformação.
- Mineração.
- Análise, assimilação, interpretação, avaliação, divulgação e exposição das informações.
-
O KDD é um processo bem intuitivo. Ele começa na seleção dos dados, que passam por um pré-processamento para serem transformados e serem alvo da mineração de dados. Por fim, há uma etapa de interpretação e avaliação dos resultados.
A letra B poderia até trazer alguma dúvida, por isso é interessante lembrar que o pré-processamento é a primeira etapa a ser realizada após a obtenção dos dados (por isso que é “pré” J). Vamos ver mais sobre essa etapa ainda na aula de hoje.
Outro detalhe importante é que a mineração permite extrair os padrões e relacionamentos ocultos no banco de dados, mas essas descobertas não têm muita serventia se não passarem por uma interpretação e avaliação dos usuários que irão realizar a tomada de decisão. A mineração não é um processo completamente automático, requerendo a intervenção humana em várias de suas etapas.
Gabarito: A
-
Letra A
KDD (extração do conhecimento)
Conceito:
“é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados.“ (FAYYAD, 1996).
__________________
Fases do KDD:
- Seleção de dados: seleciona um conjunto de dados para serem ANALISADOS (estruturados, semi-estruturados, não-estruturados)
- Pré-processamento (limpeza): eliminar ruídos, tuplas vazias, corrigir ou remover dados inconsistentes, identificar anomalias (outliers).
- Transformação dos dados: transformação dos dados utilizando métodos como: Normalização, Agregação, Criação de novos atributos, e Sintetização dos dados.
- Mineração de dados (data mining): é a fase MAIS importante do processo de KDD. Aplicam-se técnicas para extrair informações a partir de um grande volume de dados e transforma essas informações em conhecimento útil.
- Interpretação / Avaliação: interpreta e avalia os padrões extraídos na etapa de Mineração de dados. (podendo retornar a qualquer fase anterior caso seja necessário)