Questão Q405053

Question

Julgue os próximos itens, com relação a DataMining e ETL.

O uso de agrupamento (clustering) em DataMining exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares para predizer valores de variáveis.

Answer

Agrupamento (Clustering)

A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares

Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf

Answer

O correto seria:

O uso de agrupamento (clustering) em DataMining não exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares sem ter que predizer valores de variáveis.

Answer

Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

Gaba: ERRADO

Agrupamento (Clustering)

A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares

Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf

Answer

esse é o conceito de CLASSIFICAÇÃO!!!

Nela, você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva - supervisionada).

No agrupamento há apenas a separação de dados constantes no seu banco (descritivo - não supervisionada). O objetivo não é classificar novas informações!!!

Portanto, ERRADO

Answer

Trata-se de método não supervisionado (não existe rotulação dos dados)

Answer

CLUSTERING (AGRUPAMENTO)

*Identifica agrupamento de objetos

*Aprendizado não supervisionado

*Não necessita que registors sejam categorizados

OBS: essa característica o diferencia de classificação

GAB: ERRADO

Answer

Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.

Arthur Mendonça | Direção Concursos

05/12/2019 às 18:43

Answer

Essa é a classificação e não agrupamento.

Answer

Gabarito: errado

Análise de Agrupamentos é utilizado quando nenhum grupo foi definido e nenhum registro foi previamente categorizado – a questão trata da Classificação.

Questões sobre o clustering:

CESPE / CEBRASPE - 2013) Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo

(CESPE / CEBRASPE - 2021) No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

(CESPE / CEBRASPE - 2013) Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo

(CESPE / CEBRASPE - 2011) Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster), por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo. (errado)

Answer

Classificação -> exigem dados pré-definidos (SUPERVISIONADO)

Agrupamento -> NÃO exigem dados pré-definidos (NÃO SUPERVISIONADO)

Questão semelhante:

(CESPE / TCU – 2007) No datamining, o agrupamento e a classificação funcionam de maneira

similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence,

examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda

definido.

Comentários:

A questão inverteu os conceitos de agrupamento e classificação.

Answer

Classificação - Supervisionado

Clusterização - Não supervisionado

Answer

Classificação: envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Exemplo de algoritmo: SVM, árvores de decisão, classificação de risco

Agrupamentos/aglomerações (clusterização): é um exemplo de aprendizado não supervisionado. O sistema trabalha sem auxílios. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. Exemplo de algoritmo: K-Means.

Recentemente, em 2020, foi cobrada a diferença entre K-means, K-medoids e Fuzzy k-médias, fiquem de olho.

Answer

Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.

Arthur Mendonça | Direção Concursos

05/12/2019 às 18:43

Arthur Mendonça | Direção Concursos

05/12/2019 às 18:43

Answer

Agrupamento : Particiona dados em segmentos desconhecidos com características semelhantes

Answer

CLUSTER: NAO SUPERVISIONADO

Answer

ERRADO

Agrupamento: não supervisionado. à os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.

Classificação: supervisionado.

Suporte / Prevalência: Trata-se da frequência com que um conjunto de itens específico ocorre no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto (Ex: 50% das compras realizadas em um mercado contém arroz e refrigerante).

Confiança / Força: Trata-se da probabilidade de que exista uma relação entre itens (Ex: 70% dos clientes que compram fraldas também compram cerveja).

Answer

Clustering: permite segmentar automaticamente dados em grupos, de acordo com a similaridade. Cluster superestima a semelhança entre os grupos e não trata os pontos de dados como indivíduos. Por esse motivo, Clustering é inadequado para dividir grupos de clientes

Answer

Mesma história em 2020:

CESPE 2020 - A técnica de agregação na mineração de dados atua em conjunto de registros que tenham sido previamente classificados. ERRADO

Answer

ERRADO

A técnica de Agrupamento NÃO possui classes/categorias previamente definidas, além de Não possuir característica Preditiva.
Essa característica é da técnica de Classificação.

Answer

Classificação: Envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Supervisionado justamente porque o ser humano precisa fornecer alguns exemplos para que o aprendizado possa ocorrer.

Análise de agrupamentos (clusterização): É um exemplo de aprendizado não supervisionado. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais.

Answer

Descritiva: Associação, agrupamento ou clustering

Preditiva: Classificação ou Regressão, servem para predizer valores futuros.

Answer

Errado.

A questão trouxe o conceito da técnica de classificação.

A técnica de agrupamento é não-supervisionada, ou seja, quando não há uma classe associada.

Já a técnica de classificação é supervisionada, ou seja, você apresenta ao algoritmo alguns conjuntos de padrões de ENTRADA e seus correspondentes de SAÍDA, comparando-se à resposta fornecida pelo algoritmo com a resposta apresentada.

Uma questão bem recente da PF serve para responder essa:

(2021/PF) A análise de clustering é uma tarefa que consiste em agrupar um conjunto de objetos de tal forma que estes, juntos no mesmo grupo, sejam mais semelhantes entre si que em outros grupos. CERTO

(2018/FCC)Dentre os algoritmos utilizados em data mining, há um algoritmo que visa o estabelecimento de categorias, a partir do conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Essa descrição corresponde aos algoritmos de A) Classificação

Answer

As tarefas de mineração de dados são de natureza PREDITIVA ou DESCRITIVA:

PREDITIVAS (SUPERVISIONADAS): Usa algumas variáveis para prever valores desconhecidos ou futuros de outras variáveis;

EX.: Classificação e Regressão.

DESCRITIVAS (NÃO SUPERVISIONADAS): Padrões para descrever os dados

EX.: Agrupamento (Clustering) e Regras de Associação.

FONTE: Material Estúdio Aulas, prof. Léo Matos.

SóProvas

Continue usando...

O que está incluso