SóProvas


ID
1047241
Banca
CESPE / CEBRASPE
Órgão
MPU
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, acerca de sistemas de suporte à decisão.

Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas.

Alternativas
Comentários
  • CERTO

    Segundo Navathe(2011,p.712),"O objetivo do agrupamento é colocar registros em grupos, de modo que os registros em um grupo sejam semalhantes uns aos outros e diferentes dos registros em outros grupos. Os grupos constumam ser disjuntos."

    O.b.s: A técnica de agrupamento também pode ser denominada clustering.

    Bibliografia:

    SISTEMAS DE BANCO DE DADOS- NAVATHE 6 EDIÇÃO 2011
  • Os registros são agrupados em função de suas similaridades básicas, ou seja, quando se deseja formar agrupamentos (clustering), seleciona-se um conjunto de atributos (variáveis) e em função da similaridade desses atributos (faixa de valores dos atributos) são formados grupos.

  • Tecnicas de mineracao de dados:

    Regressão

    Pergunta: "Quanto uma concessionaria devería cobrar por um carro? Os modelos de regressão podem responder a essa pergunta com uma resposta numérica, usando dados de vendas passadas.

    Classificação

    Pergunta: "Qual a probabilidade de uma pessoa X comprar o mais novo modelo de carro?" Criando uma árvore de classificação, os dados podem ser minerados para determinar a probabilidade de essa pessoa comprar um novo carro. 

    Armazenamento em cluster

    Pergunta: "Que faixa etária gosta de carros da cor prata?" A partir de dados de compradores previo de carro, é possível encontrar se certas faixas etárias (22-30 anos de idade, por exemplo) estão mais propensas a comprar um certo tipo de cor (75 por cento compram azul). 

    Vizinho mais próximo

    Pergunta: "Quando as pessoas compram um carro, quais outras opções elas tendem a comprar ao mesmo tempo?" Os dados podem ser minerados para mostrar que elas também compram um som. Assim, a concessionária pode mover as promoções dos sons automotivos para a parte da frente da concessionária, em um esforço para aumentar as vendas.

  • É verdade. A análise de agrupamentos permite descrever os dados de acordo com sua afinidade com outros itens da mesma faixa de valores ou grupo. Nessa tarefa, as classes não são previamente conhecidas, sendo definidas a priori de acordo com a similaridade entre os conjuntos de valores agrupados.

  • Agrupamento = Clustering. Método NÃO SUPERVISIONADO, ou seja, descobre por sí só.

  • Agrupamento (Clusterização/Aglomeração/Agregação) é a técnica que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas. O objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. A cada conjunto de dados resultante do processo, dá-se o nome de grupo, aglomerado, agrupamento ou cluster. O agrupamento é uma técnica de aprendizado não-supervisionado, ou seja, não há um pré-estabelecimento de classes antes da análise de dados.

    Agrupamento = não-supervisionado (não estabelece classes antes da análise)

    Classificação = é supervisionado (estabelece classes antes da análise)

  • Mas permite a descoberta de dados?

    Não seria o agrupamento de dados?

  • Técnicas do Data mining:

    • Associação: representa padrões de relacionamento entre itens de uma base de dados (famoso exemplo da frauda e cerveja)

    • Classificação: ajuda a obter informações importante sobre dados e metadados. Está intimamente relacionada com a técnica de clusterização e utiliza árvore de decisão ou rede neural. (agrupa por classes)

    • Agrupamento(clustering): é uma técnica que também é conhecida como agrupamento de dados. Trata-se do processo de identificação de dados semelhantes e não semelhantes entre si.

    Gabarito: CERTO

    Espero ter ajudado!

  • Etapas do processo de descoberta de conhecimento (Knowledge discovery in Database - KDD):

    Entrada de Dados -> Pré-processamento -> Mineração -> Pós-processamento -> Informação

     

    1. Pré-processamento

    (seleção de atributos, redução de dimensionalidade, normalização, amostragem)

    2. Mineração

    (Aplicação de algoritmos de aprendizado por máquina):

    Técnicas: < Classificação - Agrupamento - Anomalias - Associações >

     

    2.1 Classificação,

    ou classificação supervisionada: O conjunto de treinamento já possui uma classe. E.g.: Predizer espécie de uma flor dadas as características dela.

    2.2 Agrupamento (Clustering):

    O conjunto de treinamento não possui classe e é aprendido automaticamente pelo algoritmo, e.g. descoberta de centróides.

    2.3 Anomalias (Anomaly Detection):

    Aprende um padrão e detecta casos que extrapolam esse padrão, e.g. análise de fraude em cartões de crédito.

    2.4 Associação (Association Analysis):

    Aprende padrão de associação entre certos atributos e deriva uma regra, e.g. market basket analysis no Walmart - quem compra cerveja compra fraldas.

     

    3. Pós-processamento

    (Filtragem de padrões, visualização, interpretação de padrões).

     

    Fonte: Tan et al, Introdução ao Data Mining.

  • CERTO

    Agrupamento (CLAUSTERING): não supervisionado. >>os dados se ligam por semelhança, aproximação. Busca-se descobrir diferentes agrupamentos de dados com registros similares entre si e diferentes dos outros registros.

  • Gabarito: certo

    Outra questão :

    Ano: 2021 Banca: CESPE / CEBRASPE Órgão:  Prova: 

    No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

  • Gabarito: certo

    Outra questão :

    Ano: 2021 Banca: CESPE / CEBRASPE Órgão:  TCE

    No método de mineração de dados por agrupamento (clustering), são utilizados algoritmos com heurísticas para fins de descoberta de agregações naturais entre objetos. (certo)

  • CERTO

    Agrupamento/Aglomerado (Clusterização) = é uma técnica de aprendizado não-supervisionado, não  necessitando que os registros sejam previamente categorizados. Visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, devendo ser executada periodicamente, não apenas na criação da tabela. O objetivo é descobrir diferentes agrupamentos de uma massa de dados e agrupá-los de uma forma que ajude com sua análise. Um agrupamento é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos

  • Assertiva correta. A clusterização é a partição de uma coleção de coisas,

    eventos ou itens em segmentos cujos membros possuem características

    semelhantes. O objetivo é classificar casos (por exemplo, pessoas, coisas,

    eventos) em grupos ou clusters, de modo que o grau de associação seja

    forte entre os membros do mesmo cluster e fraco entre os membros de

    diferentes clusters.

    Gabarito: Certo.

  • Atributos, aqui nessa questão, tem que ser entendido como "características", e entidades como os objetos analisados. Sendo assim, a técnica de agrupamento permite a descoberta de dados por faixa de valores através do exame das características dos objetos envolvidos na mineração. Um exemplo disso é o agrupamento de pessoas com uma respectiva idade, tamanho, peso etc.