Gabarito: C
A técnica de associação em data mining verifica se há controle ou influência entre atributos ou valores de atributos, no intuito de verificar, mediante a análise de probabilidades condicionais, dependências entre esses atributos.
A) Algoritmos ID3 e C4.5 são para árvore de decisão (classificação). K-means, na verdade, que é para clusterização.
As árvores de decisão são representações simples do conhecimento e têm sido aplicadas em sistemas de aprendizado. Elas são amplamente utilizadas em algoritmos de classificação, como um meio eficiente para construir classificadores que predizem classes baseadas nos valores de atributos. Assim, podem ser utilizadas em várias aplicações como diagnósticos médicos, análise de risco em créditos, entre outros exemplos.
B) Basket é regra de associação;
D) Embora KDD e Data Mining sejam frequentemente entendidos como sinônimos, é importante frisar que, enquanto o KDD compreende todas as etapas para a descoberta do conhecimento a partir da existência de dados, a Mineração de Dados é apenas e tão somente uma das etapas do processo.
E) O objetivo principal de clustering é separar objetos ou observações em classes naturais, de forma que, os elementos pertencentes a um mesmo grupo tenham um alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos, tenham pouca semelhança entre si.
Aprofundando:
Cada tipo de aplicação de DM é suportado por um conjunto de aproximações algorítmicas que são utilizadas para extrair as relações relevantes nos dados. Estas aproximações diferem em função do tipo de problema que visam solucionar. A maioria dos investigadores nesta área divide os estudos de DM da seguinte forma:
º Classificação e regressão (aprendizagem supervisionada);
º Clusterização (aprendizagem não supervisionada);
º Associação (aprendizagem não supervisionada);
º Análise de sequenciação (aprendizagem não supervisionada);
º Estimação (aprendizagem supervisionada);
º Visualização.