Questão Q835195

O agrupamento de dados no processo de data mining procura, em uma massa de dados que caracterizam uma população de indivíduos, grupos semelhantes e diferentes. O algoritmo baseado na teoria dos grafos e que dispensa a definição de protótipos utilizado para segmentar a base de dados em diferentes grupos é denominado

Alternativas

K média.

K medoides.

Apriori.

DBSCAN.

Árvore geradora mínima.

Comentários

Árvore geradora
ok, baseado em Grafos, mas o que tem a ver com Data Mining? Como aplicar a MST em Data Mining? Até em redes tudo bem, mas em DM não estou conseguindo visualizar
Agrupamento é uma tarefa importante na mineração de dados, tendo como objetivo segmentar uma base de dados em grupos de objetos baseando-se na similaridade ou dissimilaridade entre os mesmos.

Aárvore geradora mínima (MST, do inglês Minimum Spanning Tree) de um grafo não orientado é a árvore que conecta todos os vértices do grafo com o menor peso total possível Os algoritmos de agrupamento de dados baseados em árvores geradoras mínimas são capazes de detectar grupos com fronteiras irregulares.
Para quem quiser mais:

a) https://en.wikipedia.org/wiki/K-means_clustering

b) https://pt.wikipedia.org/wiki/Algoritmo_apriori

c) https://pt.wikipedia.org/wiki/Algoritmo_apriori

d) https://en.wikipedia.org/wiki/DBSCAN

e) https://pt.stackoverflow.com/questions/22245/o-que-%C3%A9-%C3%A1rvore-geradora-m%C3%ADnima
Uma arvore geradora e chamada minima se, dentre todas as arvores geradoras que existem no grafo, a soma dos pesos nas arestas dela e o menor possível.
Questão que define árvore geradora mínima, portanto o Gabarito é letra E.
Vejamos os conceitos dos demais algoritmos:
a) K média (K-means): o algoritmo atribui cada ponto de dados (cliente,
evento, objeto, etc.) ao cluster cujo centro (também chamado centróide) é o
mais próximo. O centro é calculado como a média de todos os pontos no cluster;
ou seja, suas coordenadas são a média aritmética para cada dimensão
separadamente em todos os pontos do cluster.
b) K medoides (K-medoids): o elemento que melhor representa o cluster, é
definido de acordo com seus atributos sem que haja muita influência dos valores
próximos aos limites do cluster.
c) Apriori: dado um conjunto de itens, o algoritmo tenta encontrar
subconjuntos que são comuns a, pelo menos, um número mínimo de conjuntos.
d) DBSCAN: dado um conjunto de pontos em algum espaço, agrupa pontos que
estão intimamente empacotados (pontos com muitos vizinhos próximos),
marcando como pontos atípicos que ficam sozinhos em regiões de baixa
densidade (cujos vizinhos mais próximos estão muito distantes).
Gabarito: Letra E.
Prof. Ramon Souza
Digitem no google imagens: árvore geradora mínima
Se a prova da PF vir no mesmo nível da PRF 2021, o ponto de corte será 25 pontos líquidos.

SóProvas

Continue usando...

O que está incluso