SóProvas


ID
2505592
Banca
CESPE / CEBRASPE
Órgão
TRE-BA
Ano
2017
Provas
Disciplina
Banco de Dados
Assuntos

O agrupamento de dados no processo de data mining procura, em uma massa de dados que caracterizam uma população de indivíduos, grupos semelhantes e diferentes. O algoritmo baseado na teoria dos grafos e que dispensa a definição de protótipos utilizado para segmentar a base de dados em diferentes grupos é denominado

Alternativas
Comentários
  • Árvore geradora
  • ok, baseado em Grafos, mas o que tem a ver com Data Mining? Como aplicar a MST em Data Mining? Até em redes tudo bem, mas em DM não estou conseguindo visualizar

  • Agrupamento é uma tarefa importante na mineração de  dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos.

     

    Aárvore geradora mínima (MST, do inglês Minimum Spanning Tree) de um grafo não orientado é a árvore que conecta todos os vértices do grafo com o menor peso total possível Os algoritmos de agrupamento de dados baseados em árvores geradoras mínimas são capazes de detectar grupos com fronteiras irregulares.

     

     

     

     

  • Para quem quiser mais:

    a) https://en.wikipedia.org/wiki/K-means_clustering

    b) https://pt.wikipedia.org/wiki/Algoritmo_apriori

    c) https://pt.wikipedia.org/wiki/Algoritmo_apriori

    d) https://en.wikipedia.org/wiki/DBSCAN

    e) https://pt.stackoverflow.com/questions/22245/o-que-%C3%A9-%C3%A1rvore-geradora-m%C3%ADnima

  • Uma arvore geradora e chamada minima se, dentre todas as arvores geradoras que existem no grafo, a soma dos pesos nas arestas dela e o menor possível. 

  • Questão que define árvore geradora mínima, portanto o Gabarito é letra E.

    Vejamos os conceitos dos demais algoritmos:

    a) K média (K-means): o algoritmo atribui cada ponto de dados (cliente,

    evento, objeto, etc.) ao cluster cujo centro (também chamado centróide) é o

    mais próximo. O centro é calculado como a média de todos os pontos no cluster;

    ou seja, suas coordenadas são a média aritmética para cada dimensão

    separadamente em todos os pontos do cluster.

    b) K medoides (K-medoids): o elemento que melhor representa o cluster, é

    definido de acordo com seus atributos sem que haja muita influência dos valores

    próximos aos limites do cluster.

    c) Apriori: dado um conjunto de itens, o algoritmo tenta encontrar

    subconjuntos que são comuns a, pelo menos, um número mínimo de conjuntos.

    d) DBSCAN: dado um conjunto de pontos em algum espaço, agrupa pontos que

    estão intimamente empacotados (pontos com muitos vizinhos próximos),

    marcando como pontos atípicos que ficam sozinhos em regiões de baixa

    densidade (cujos vizinhos mais próximos estão muito distantes).

    Gabarito: Letra E.

    Prof. Ramon Souza

  • Digitem no google imagens: árvore geradora mínima

  • Se a prova da PF vir no mesmo nível da PRF 2021, o ponto de corte será 25 pontos líquidos.