SóProvas


ID
1215166
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, com relação a DataMining e ETL.

O uso de agrupamento (clustering) em DataMining exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares para predizer valores de variáveis.

Alternativas
Comentários
  • Agrupamento (Clustering)

    A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares


    Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf

  • O correto seria:


    O uso de agrupamento (clustering) em DataMining não exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares sem ter que predizer valores de variáveis.

  • Para quem não entende os comentários sem o gabarito e não tem acesso a resposta.

    Gaba: ERRADO

     

     

    Agrupamento (Clustering)

    A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster ) é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos. Esta tarefa difere da classificação pois não necessita que os registros sejam previamente categorizados (aprendizado não-supervisionado). Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares

     

     

    Fonte: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf

  • esse é o conceito de CLASSIFICAÇÃO!!!

    Nela, você estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram (preditiva - supervisionada).

     

    No agrupamento há apenas a separação de dados constantes no seu banco (descritivo - não supervisionada). O objetivo não é classificar novas informações!!!

     

    Portanto, ERRADO

  • Trata-se de método não supervisionado (não existe rotulação dos dados)

  • CLUSTERING (AGRUPAMENTO)

     

    *Identifica agrupamento de objetos

     

    *Aprendizado não supervisionado

     

    *Não necessita que registors sejam categorizados

    OBS: essa característica o diferencia de classificação

     

     

    GAB: ERRADO

  • Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.

  • Essa é a classificação e não agrupamento.

  • Gabarito: errado

    Análise de Agrupamentos é utilizado quando nenhum grupo foi definido e nenhum registro foi previamente categorizado – a questão trata da Classificação.

    Questões sobre o clustering:

    CESPE / CEBRASPE - 2013) Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. Certo

    (CESPE / CEBRASPE - 2021) No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

     (CESPE / CEBRASPE - 2013) Em algoritmos de clusterização hierárquica, os clusters são formados gradativamente por meio de aglomerações ou divisões de elementos, gerando uma hierarquia de clusters. Certo

     (CESPE / CEBRASPE - 2011) Um dos métodos de classificação do datamining é o de análise de agrupamento (cluster), por meio do qual são determinadas características sequenciais utilizando-se dados que dependem do tempo, ou seja, extraindo-se e registrando-se desvios e tendências no tempo. (errado)

  • Classificação -> exigem dados pré-definidos (SUPERVISIONADO)

    Agrupamento -> NÃO exigem dados pré-definidos (NÃO SUPERVISIONADO)

    Questão semelhante:

    (CESPE / TCU – 2007) No datamining, o agrupamento e a classificação funcionam de maneira

    similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence,

    examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda

    definido.

    Comentários:

    A questão inverteu os conceitos de agrupamento e classificação.

  • Classificação - Supervisionado

    Clusterização - Não supervisionado

  • Classificação: envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Exemplo de algoritmo: SVM, árvores de decisão, classificação de risco

    Agrupamentos/aglomerações (clusterização): é um exemplo de aprendizado não supervisionado. O sistema trabalha sem auxíliosEnvolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. Exemplo de algoritmo: K-Means. 

    Recentemente, em 2020, foi cobrada a diferença entre K-means, K-medoids e Fuzzy k-médias, fiquem de olho.

  • Pelo contrário! Os registros na clusterização não possuem rótulos ou etiquetas prévias, os algoritmos geram os conjuntos a partir da similaridade entre os elementos, sendo esse um exemplo de aprendizado de máquina não supervisionado. A descrição da assertiva, na verdade, se amolda à classificação.

    Arthur Mendonça | Direção Concursos

    05/12/2019 às 18:43

  • Agrupamento :  Particiona dados em segmentos desconhecidos com características semelhantes

    • CLUSTER: NAO SUPERVISIONADO
  • ERRADO

    Agrupamento: não supervisionado. à os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.

    Classificação: supervisionado.

    Suporte / Prevalência: Trata-se da frequência com que um conjunto de itens específico ocorre no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto (Ex: 50% das compras realizadas em um mercado contém arroz e refrigerante).

    Confiança / Força: Trata-se da probabilidade de que exista uma relação entre itens (Ex: 70% dos clientes que compram fraldas também compram cerveja).

  • Clustering: permite segmentar automaticamente dados em grupos, de acordo com a similaridade. Cluster superestima a semelhança entre os grupos e não trata os pontos de dados como indivíduos. Por esse motivo, Clustering é inadequado para dividir grupos de clientes

  • Mesma história em 2020:

    CESPE 2020 - A técnica de agregação na mineração de dados atua em conjunto de registros que tenham sido previamente classificados. ERRADO

  • ERRADO

    • A técnica de Agrupamento NÃO possui classes/categorias previamente definidas, além de Não possuir característica Preditiva.
    • Essa característica é da técnica de Classificação.
    • Classificação: Envolve descrever os dados em função de algumas classes predeterminadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado. Supervisionado justamente porque o ser humano precisa fornecer alguns exemplos para que o aprendizado possa ocorrer.

    • Análise de agrupamentos (clusterização): É um exemplo de aprendizado não supervisionado. Envolve a divisão dos dados em grupos semelhantes entre si e diferentes dos demais. 

  • Descritiva: Associação, agrupamento ou clustering

    Preditiva: Classificação ou Regressão, servem para predizer valores futuros.

  • Errado.

    A questão trouxe o conceito da técnica de classificação.

    A técnica de agrupamento é não-supervisionada, ou seja, quando não há uma classe associada.

    Já a técnica de classificação é supervisionada, ou seja, você apresenta ao algoritmo alguns conjuntos de padrões de ENTRADA e seus correspondentes de SAÍDA, comparando-se à resposta fornecida pelo algoritmo com a resposta apresentada.

    Uma questão bem recente da PF serve para responder essa:

    (2021/PF) A análise de clustering é uma tarefa que consiste em agrupar um conjunto de objetos de tal forma que estes, juntos no mesmo grupo, sejam mais semelhantes entre si que em outros grupos. CERTO 

    (2018/FCC)Dentre os algoritmos utilizados em data mining, há um algoritmo que visa o estabelecimento de categorias, a partir do conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Essa descrição corresponde aos algoritmos de A) Classificação

  • As tarefas de mineração de dados são de natureza PREDITIVA ou DESCRITIVA:

    • PREDITIVAS (SUPERVISIONADAS): Usa algumas variáveis para prever valores desconhecidos ou futuros de outras variáveis;

    EX.: Classificação e Regressão.

    • DESCRITIVAS (NÃO SUPERVISIONADAS): Padrões para descrever os dados

    EX.: Agrupamento (Clustering) e Regras de Associação.

    FONTE: Material Estúdio Aulas, prof. Léo Matos.