-
Uma das técnicas estatísticas utilizadas em Data Mining é Clustering (Análise de Cluster,
ou agrupamentos). Clustering é um ramo da Estatística Multivariada que engloba
métodos utilizados para descobrir estruturas em um conjunto complexo de dados. O
objetivo principal de clustering é separar objetos ou observações em classes naturais de
forma que os elementos pertencentes a um mesmo grupo tenham um alto grau de
semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos
distintos, tenham pouca semelhança entre si (Andeberg, 1973).
O atrativo dos métodos de clustering para tarefas de mineração de dados é a sua
habilidade de extrair estruturas diretamente dos dados, sem nenhum conhecimento
prévio. Métodos de clustering para Data Mining, são utilizados com modificações em
relação aos algoritmos tradicionais, sobretudo visando aumentar sua eficiência, diante
da quantidade de objetos a serem classificados no contexto de Data Mining (Ng e Han,
1994) (Koperski, et al., 1997) (Zhang et al., 2001).
-
O maravilha mais uma questão retirada literalmente de uma bibliografia consagrada
Vamos lá:
"Clustering(Agrupando) - uma dada população de eventos ou novos itens particonados(segmentados) em conjunto de elementos 'similares' . Exemplos:(1) \uma população de dados sobre o tratamento de uma doença pode ser dividida em grupos baseados na similiaridade dos efeitos colaterais produzidos.(...)" - Sistemas de banco de Dados - Elmasri e Navathe 4ª ed pag 627
Fácil para quem estudou pelo livro e fez seu "bizurado" resumo
Vamos a oração do concurseiro de TI
"Senhor me dê sabedoria para descobrir o material correto a ser estudado,
recursos para adquiri-los
paciencia para estuda-los
Tire de mim toda a vontade de pesquisar no Goggle
e me mantenha firme nas bibliografias corretas
Amém"
-
Apenas para complementar... A diferença entre "cluestering" e "classificação":
- Agregação(ou clustering ou agrupamento) consiste na busca de similaridades entre os dados tal que permita definir um conjunto finito de classes ou categorias que os contenha e os descreva. A principal diferença entre esta abordagem e classificação é que em agregação não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem. Descobrir grupos homogêneos de clientes é uma das possíveis aplicações e pode ser usada para ajudar na definição da estratégia de marketing a ser adotada.
-
Gostei da oração kkkkkkkk
-
Realmente, fiquei na dúvida entre classificação e clustering.
Apesar de ter estudado o data mining pelo livro do Elmasri, eu aprendi somente o conceito de classificação e agrupamento (clustering), sabendo diferenciar que no caso do agrupamento (clustering) as classificações são feitas de forma automática, também chamada de classificação não supervisionada. Em outras palavras, não se tem conhecimento prévio dos grupos possíveis de classificação e o próprio mining através do agrupamento realiza a classificação sozinho.
Em nenhum momento eu li na questão as palavras-chaves: segmentação automática, segmentação não supervisionada, segmentação sem conhecimento prévio...
Portanto, continuo entendendo que a resposta correta dessa questão seja a letra c) classificação.
-
Letra D
Palavras-Chaves para ajudar na resposta:
Classificação = CLASSE, CATEGORIA, CATEGORIZAR
Estimação = USO DE VALORES NÚMERICOS, ESTIMAR VALOR
Predição = MAPEAMENTO de valores ASSOCIADOS aos dados
Clustering = APROXIMAR REGISTROS SIMILARES
Associação = ATRIBUTOS RELACIONADOS
-
Análise de Clusters (Agrupamentos)
• Consiste em identificar agrupamentos de objetos, estes que identificam uma classe.
• Trabalha sobre dados onde as etiquetas das classes não estão definidas.
• Conhecido também por aprendizado não supervisionado e, às vezes, chamado de classificação por estatísticos e de segmentação por pessoas de marketing.
Tipos de Agrupamento
• Algoritmos Particionais:
– Construir diversas partições e avaliá-las com algum critério
• Algoritmos Hierárquicos:
– Criar uma decomposição hierárquica de um conjunto de objetos utilizando algum critério
Fonte: Itnerante
-
A técnica da mineração de dados que divide os elementos de dados em grupos de acordo com sua similaridade é a clusterização, também conhecida como análise de agrupamentos ou de conglomerados. É uma técnica relacionada ao aprendizado não supervisionado e seus grupos não são definidos a priori.
Gabarito: D
-
Falou em divisão em grupos similares, marca clusterização sem medo.
-
O enunciado não deixa claro se as classes de mapeamento são pré ou pós definidas. Mas como é literal do livro-base do assunto, não tem o que discutir. Imagino eu que, no livro, esteja melhor contextualizado o parágrafo.