SóProvas


ID
4863976
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o seguinte item, a respeito de big data.


A técnica de agregação na mineração de dados atua em conjunto de registros que tenham sido previamente classificados.

Alternativas
Comentários
  • Classificação => Consiste em examinar uma certa característica nos dados e atribuir uma classe previamente definida.

    Agregação => Agrupamentos ou Clusterização

    _______________________________________________________________________

    Agregação é uma das etapas da Transformação de Dados.

    Transformação de Dados => Os dados são transformados e consolidados em formatos apropriados para a atividade de garimpagem (mining). A transformação de dados envolve:

    - Smooting (aplainamento)

    - Agregação

    - Generalização

    - Normalização

    - Construção de atributos

    #Agregação – Aplica operações de sumarização e agregação nos dados. Por exemplo, vendas diárias são agregadas em vendas semanais, quinzenais e mensais. Tipicamente usada para geração de dados no formato multidimensional em dados com alta granularidade (muitos detalhes).

    Gab.: Errado

  • Estimação e Classificação são as unicas tecnicas supervisionadas

  • Agregação é um tipo de aprendizado não supervisionado, ou seja, os dados não estão previamente rotulados ou classificados.

    Gabarito: ERRADO.

    Fonte: Prof. Thiago Cavalcanti

    Estratégia

  • Atenção para não confundir agregação com classificação. A técnica que utiliza classes previamente definidas é a classificação e não a agregação (agrupamentos ou clusterização).

    exponencial concursos

  • CLASSIFICAÇÃO – ATIVIDADE SUPERVISIONADA >> Já sabemos atributos conhecidos.

    CLUSTERING “AGRUPAMENTO” – ATIVIDADE NÃO SUPERVISIONADA >> Utilizado para encontrar padrões inesperados nos dados

  • Agregação = Agrupamento = Clusterização = análise por afinidade

  • CESPE 2014 - O uso de agrupamento (clustering) em DataMining exige que os registros sejam previamente categorizados, tendo por finalidade aproximar registros similares para predizer valores de variáveis. ERRADO.

  • GABARITO ERRADO

    O agrupamento é uma técnica que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas. Como o nome sugere, o objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise.

     Esta tarefa difere da classificação uma vez não necessita que os registros sejam previamente categorizados – trata-se de um aprendizado não-supervisionado. Além disso, ela não tem a pretensão de classificar, estimar ou predizer o valor de uma variável, ela apenas identifica os grupos de dados similares.

    Fonte: pdf estratégia.

  • Gabarito: ERRADO

    AGREGAÇÃO = AGRUPAMENTO = CLUSTERING

    Características:

    -- Aprendizado NÃO-supervisionado

    -- Realiza a identificação de dados similares e os agrupa

    -- NÃO há pré-definição de grupos

    -- NÃO realiza classificação e NÃO estima valores

    Erro: A técnica de agregação na mineração de dados atua em conjunto de registros que tenham sido previamente classificados.

  • Agrupamento  : particiona dados em segmentos desconhecidos com características semelhantes

  • ERRADO.

    Na CLASSIFICAÇÃO é que os registros são PRÉ-ESTABELECIDOS e é um exemplo de aprendizado SUPERVISIONADO.

    Na AGREGAÇÃO ( agrupamento) os registros NÃO SÃO PRÉ-ESTABELECIDOS e é um exemplo de aprendizado NÃO SUPERVISIONADO.

    Essa é a principal diferença entre as duas técnicas.

    "você é o que você pensa é o sr do seu destino."

  • Principais tarefas (ou técnicas) da Mineração de Dados

    PREDITIVAS

    Aprendizado supervisionado, ou seja, os dados estão previamente rotulados ou classificados

    Classificação: atribuição de uma das classes predefinidas pelo analista a novos fatos ou objetos submetidos à classificação. CESPE (2014) destacou que com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos.

    Regressão: é predizer um valor numérico a partir de um conjunto de atributos fornecidos. A regressão pode ser considerada uma variação da classificação, pois prevê um valor numérico contínuo ao invés de um valor categórico (ou nominal).

    Detecção de desvios: identificar observações cujas características sejam significativamente diferentes do resto dos dados.

    DESCRITIVAS

    Aprendizado não supervisionado, ou seja, os dados não estão previamente rotulados ou classificados.

    Clustering, clusterização ou agregação: agrupar ou segmentar uma coleção de objetos em subconjuntos, chamados de clusters. A análise de clusters pode ser baseada em métodos estatísticos como o k-means (media), k-modes (moda), k-medoids (mediana – valor mais ao centro do conjunto de dados) etc.

    Regras de associação: permitem a identificação de grupos de dados que apresentam coocorrência entre si (Ocorrência simultânea de duas coisas, fatos etc. Por exemplo, em uma cesta de compras, pessoas que compraram o item X também compraram o Y.).

    Fonte: Grancursos - prof Patrícia Quintão

    Bons estudos! ;)

  • Do modo simples

    Agregação é a técnica que deixa o sistema de mineração de dados trabalhar sozinho sem previamente classificado e sem supervisionamento.

    Já a classificação é o contrario da agregação.

    Conceito mencionado da questão é de Classificação não Agregação.

    Classificação: A tarefa de Classificação é uma tarefa da mineração de dados que associa ou classifica objetos a determinadas classes, ela busca prever uma classe de um novo dado automaticamente.

    --------------------------------------------------------------------------------------------------------------------------------------------

    No método de classificação para mineração de dados, a filiação dos objetos é obtida por meio de um processo não supervisionado de aprendizado, em que somente as variáveis de entrada são apresentadas para o algoritmo. ERRADO - SUPERVISIONADO

  • calma vai dar certo,

    Técnica de agrupamento (clustering)

    permite a descoberta de dados por faixa de

    valores,

     

    ·        explorar grandes quantidades

    de dados

    ·        procura de padrões

    consistentes

    ·        regras de associação ou

    sequências temporais

    ·        detectando assim novos

    subconjuntos

    ·        processo de descoberta automática de

    informações úteis

    ·        destaca-se

    o reconhecimento de padrões por meio de

    comparação e análise dos dados

  • Conceito de Classificação.

  • Agregação/ Agrupamento : NÃO superviosiona.

  • AGREGAÇÃO / AGRUPAMENTO / CLUSTERIZAÇÃO= NÃO SUPERVISIONADOS

  • AGREGAÇÃO:

    • É uma técnica de agrupamento automático de dados segundo seu grau de semelhança
    • NÃO é previamente classificado
    • NÃO é supervisionado
  • Agregação = clusters = aprendizado não supervisionado !

  • Comentário: É uma ferramenta de análise exploratória de dados, cujo objetivo é fortificar o grau de associação, ou seja, grau de associação forte entre membros do mesmo cluster e entre membros de clusters diferentes associações fracas. Aprendizado não supervisionado em um conjunto de dados ainda não classificados. Errado 

    Hachid Targino

  • Falso

    Agregação é um tipo de aprendizado não supervisionado, ou seja, os dados não estão previamente rotulados ou classificados.

    1)Agregação/ clustering(AGRUPAMENTO) = O objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. Ele é Não supervisionado(não classificado previamente)!

    2)Classificação = ultiliza dados que tenham sido previamente classificados. => supervisionado(classsificado previamente)

  • agregação e associação não são supervisionados

  • Macetão:

    Se começar com "A": Não-supervisionado.

    Se não começar com "A": Supervisionado.

    GG!

  • Como eu decorei:

    -se começar com é não supervisionado

    -se não começar com A é supervisionado

    NÃO supervisionados:

    • Agrupamento (lembrar que também pode ser chamado de Clustering)
    1. Análise de agrupamentos (Clusterização ou análise de aglomerações ou análise de partições)
    2. Busca classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters

    • Associação

    Supervisionados:

    • Classificação
    • Regressão
    • Detecção de desvios

    GAB.: ERRADO.

    Fonte: vivendo e aprendendo com os colegas do QC..

  • ERRADO

    • A técnica de Agrupamento NÃO possui classes/categorias previamente definidas, além de Não possuir característica Preditiva.
    • Essa característica é da técnica de Classificação.

  • Agregação ou clusterização é um aprendizado não supervisionado

  • Agregação, clusterização e agrupamento, alguns sinônimos para essa técnica de aprendizado não supervisionado.

  • CLUSTERIZAÇÃO 

    É uma técnica que também é conhecida como agrupamento de dados. 

    Trata-se do processo de identificação de dados semelhantes e não semelhantes entre si. 

    Essa segmentação é fundamental para a seleção de grupos de dados e posterior geração de insights. 

    Na análise de agrupamento (clustering), os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros. 

    É um método de aprendizado não-supervisionado e, portanto, utiliza-se a heurística (aproximação progressiva) para descoberta dos clusters. 

    Vejam, se o agrupamento é para descoberta de dados com registros similares não faz sentido falar em dados pré-classificados.

  • ERRADO !

    A técnica de agregação / agrupamento, consiste em um aprendizado não supervisionado. Portanto, não atua com informações previamente classificadas.

    Seguimos !

  • A técnica que utiliza classes previamente definidas é a classificação e não a agregação (agrupamentos ou clusterização).

    Gabarito errado. ❌

  • Se liga no bizu que pode ser de mais valia.

    Mineração de Dados (Descobrir conexões escondidas e prever tendências futuras)

    -se começar com A é não supervisionado

    -se não começar com A é supervisionado

    NÃO supervisionados: utiliza-se a heurística (aproximação progressiva)

    ·                   Agrupamento (lembrar que também pode ser chamado de Clustering)

    ·                   Associação (alta probabilidade de coocorrência.) (encontrar correlação entre itens)

    Supervisionados: (há conjunto de treinamento e grupos predefinidos)

    ·                   Classificação (estabelece um modelo com base nos seus dados já classificados para classificar aqueles que ainda não foram)

    ·                   Regressão

    ·                   Detecção de desvios

    Os principais métodos de mineração de dados:

    Rede Neurais

    ·                   Árvore de Decisão

    ·                   Algoritmos Genéticos

    ·                   Lógica Fuzzy (Difusa)

    ·                   Estatística

  • Sinceramente eu não sei o que ele quiz dizer com AGREGAÇÃO.

    Pode ser tanto clustering quanto associação. No meu ponto de vista, que não vale nada, esse termo (agregação) fica no meio dos dois supracitados.

    Enfim, eu usei quarto princípio de Nishimura. Se você nunca ouviu falar no termo, provavelmente a questão está errada. Como aqui a gente pode chutar, eu chutei. kkkk

    Gabarito:Errado

  • Quanto ao nível de Manipulação:

    Independentes;

    Dependentes;

    Quando ao nível de Mensuração:

    Qualitativas: podem ser nominais ou ordinais;

    Quantitativas: podem ser discretas ou contínuas;

  • Agregação significa “agrupamento” ou “clusterização”. O modelo previamente classificado é a organização ensinada ao algoritmo para que este trabalhe na mineração de dados, ou seja, é um algoritmo supervisionado. Desta forma, o agrupamento não é ensinado anteriormente, sendo, portanto, não super-visionado.

    GAB: ERRÔNEO

  • Análise de agrupamentos ( Clusterização ) : Não é supervisionado e não é pré classificado.