-
Agrupamento (Clustering)
A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares
Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf
-
O correto seria:
O uso de agrupamento (clustering) em DataMining não exige que
os registros sejam previamente categorizados, tendo por finalidade
aproximar registros similares sem ter que predizer valores de variáveis.
-
Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.
Gaba: ERRADO
Agrupamento (Clustering)
A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares
Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf
-
esse é o conceito de CLASSIFICAÇÃO!!!
Nela, você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva - supervisionada).
No agrupamento há apenas a separação de dados constantes no seu banco (descritivo - não supervisionada). O objetivo não é classificar novas informações!!!
Portanto, ERRADO
-
Trata-se de método não supervisionado (não existe rotulação dos dados)
-
CLUSTERING (AGRUPAMENTO)
*Identifica agrupamento de objetos
*Aprendizado não supervisionado
*Não necessita que registors sejam categorizados
OBS: essa característica o diferencia de classificação
GAB: ERRADO
-
Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.
-
Essa é a classificação e não agrupamento.
-
Gabarito: errado
Análise de Agrupamentos é utilizado quando nenhum grupo foi definido e nenhum registro foi previamente categorizado – a questão trata da Classificação.
Questões sobre o clustering:
CESPE / CEBRASPE - 2013) Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo
(CESPE / CEBRASPE - 2021) No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)
(CESPE / CEBRASPE - 2013) Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo
(CESPE / CEBRASPE - 2011) Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster), por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo. (errado)
-
Classificação -> exigem dados pré-definidos (SUPERVISIONADO)
Agrupamento -> NÃO exigem dados pré-definidos (NÃO SUPERVISIONADO)
Questão semelhante:
(CESPE / TCU – 2007) No datamining, o agrupamento e a classificação funcionam de maneira
similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence,
examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda
definido.
Comentários:
A questão inverteu os conceitos de agrupamento e classificação.
-
Classificação - Supervisionado
Clusterização - Não supervisionado
-
Classificação: envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Exemplo de algoritmo: SVM, árvores de decisão, classificação de risco
Agrupamentos/aglomerações (clusterização): é um exemplo de aprendizado não supervisionado. O sistema trabalha sem auxílios. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. Exemplo de algoritmo: K-Means.
Recentemente, em 2020, foi cobrada a diferença entre K-means, K-medoids e Fuzzy k-médias, fiquem de olho.
-
Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.
Arthur Mendonça | Direção Concursos
05/12/2019 às 18:43
-
Agrupamento : Particiona dados em segmentos desconhecidos com características semelhantes
-
- CLUSTER: NAO SUPERVISIONADO
-
ERRADO
Agrupamento: não supervisionado. à os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.
Classificação: supervisionado.
Suporte / Prevalência: Trata-se da frequência com que um conjunto de itens específico ocorre no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto (Ex: 50% das compras realizadas em um mercado contém arroz e refrigerante).
Confiança / Força: Trata-se da probabilidade de que exista uma relação entre itens (Ex: 70% dos clientes que compram fraldas também compram cerveja).
-
Clustering: permite segmentar automaticamente dados em grupos, de acordo com a similaridade. Cluster superestima a semelhança entre os grupos e não trata os pontos de dados como indivíduos. Por esse motivo, Clustering é inadequado para dividir grupos de clientes
-
Mesma história em 2020:
CESPE 2020 - A técnica de agregação na mineração de dados atua em conjunto de registros que tenham sido previamente classificados. ERRADO
-
ERRADO
- A técnica de Agrupamento NÃO possui classes/categorias previamente definidas, além de Não possuir característica Preditiva.
- Essa característica é da técnica de Classificação.
-
- Classificação: Envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Supervisionado justamente porque o ser humano precisa fornecer alguns exemplos para que o aprendizado possa ocorrer.
- Análise de agrupamentos (clusterização): É um exemplo de aprendizado não supervisionado. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais.
-
Descritiva: Associação, agrupamento ou clustering
Preditiva: Classificação ou Regressão, servem para predizer valores futuros.
-
Errado.
A questão trouxe o conceito da técnica de classificação.
A técnica de agrupamento é não-supervisionada, ou seja, quando não há uma classe associada.
Já a técnica de classificação é supervisionada, ou seja, você apresenta ao algoritmo alguns conjuntos de padrões de ENTRADA e seus correspondentes de SAÍDA, comparando-se à resposta fornecida pelo algoritmo com a resposta apresentada.
Uma questão bem recente da PF serve para responder essa:
(2021/PF) A análise de clustering é uma tarefa que consiste em agrupar um conjunto de objetos de tal forma que estes, juntos no mesmo grupo, sejam mais semelhantes entre si que em outros grupos. CERTO
(2018/FCC)Dentre os algoritmos utilizados em data mining, há um algoritmo que visa o estabelecimento de categorias, a partir do conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Essa descrição corresponde aos algoritmos de A) Classificação
-
As tarefas de mineração de dados são de natureza PREDITIVA ou DESCRITIVA:
- PREDITIVAS (SUPERVISIONADAS): Usa algumas variáveis para prever valores desconhecidos ou futuros de outras variáveis;
EX.: Classificação e Regressão.
- DESCRITIVAS (NÃO SUPERVISIONADAS): Padrões para descrever os dados
EX.: Agrupamento (Clustering) e Regras de Associação.
FONTE: Material Estúdio Aulas, prof. Léo Matos.