Questão Q842568

Em relação à análise de agrupamentos (clusterização) em mineração de dados, julgue o item seguinte.

O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média.

Alternativas

Certo

Errado

Comentários

O algoritmo de K-means é de fato um método de clusterização. Confesso que essa informação não foi vista no nosso curso. O algoritmo inicia com a escolha dos k elementos que formaram as sementes iniciais. Vamos tentar entender um pouco mais do funcionamento do mesmo.

Escolhidas as sementes iniciais, é calculada a distância de cada elemento em relação às sementes, agrupando o elemento ao grupo que possuir a menor distância (mais similar) e recalculando o centroide do mesmo. Quando temos mais de um elemento, imagine vários pontos em um papel, o centroide é um ponto central entre esses pontos. O processo é repetido até que todos os elementos façam parte de um dos clusters.

Depois desta etapa, fazemos ajustes nos elementos usando métodos estatísticos que tentam diminuir a dispersão dentro de cada grupo, por meio da mudança de elementos entre os grupos. O processo é interrompido quando a mudança de um elemento de um cluster para outro não gera mais ganho.

Para visualizar o algoritmo funcionando, você pode olhar na página da Wikipédia em inglês. Para saber a fonte da questão, basta acessar a definição da Wikipédia em português: “Em mineração de dados, agrupamento k-means é um método de Clustering que objetiva particionar n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média. Isso resulta em uma divisão do espaço de dados em um Diagrama de Voronoi.”

Desta forma, a alternativa está correta.
Em mineração de dados, agrupamento k-means é um método de Clustering que objetiva particionar n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média. Isso resulta em uma divisão do espaço de dados em um Diagrama de Voronoi.

Questão retirada da Wikipedia: https://pt.wikipedia.org/wiki/K-means
O agrupamento K menas posiciona os centroides K de forma aleatória e então divide os grupos. Assim ele vai recalculando o K até ele sem estabilizar e finalmente verificar dois grupos distintos. Esse algoritmo é usado em aprendizado de máquinas não supervisionados.

Fonte: Thiago Pádua - gran cursos
E pensar que a PF vai cobrar isso na suas provas PQP ! sem lógica nenhuma, matéria pra auditor fiscal !
to tranquilo dessa questão kkkkkk
A CESPE ta copiando questão da WikiPedia, fala sério

https://pt.wikipedia.org/wiki/K-means
K - means -> média
K - mods -> moda
K - medoids -> mediana

Não desiste!
Definição copia e cola da Wikipedia. É isso mesmo. No k-means, cada valor irá fazer parte do grupo a que mais se aproxima da média. É importante que você não o confunda com o algoritmo k-nearest neighbor (KNN), que é um algoritmo de classificação.
Cespe dados Clustering K Means

cluster = aglomerar, aglomeração

O que é k-means?

K-means é um algoritmo de aprendizagem não supervisionada que agrupa dados com base em sua similaridade.

Aprendizagem não supervisionada significa que não há resultado a ser previsto, e o algoritmo apenas tenta encontrar padrões nos dados.
Este assunto se refere a algoritmos de AGRUPAMENTO em mineração de dados.

Segundo Navathe (2018), página 983, funciona assim:

IDEIA CENTRAL: o algoritmo escolhe aleatoriamente K (daí o nome k-means), que servirão como novas médias, de modo que o conjunto tenha mais de uma média e vai fazendo operações aproximando os demais registros, é o que diz a questão: "objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média".

GABARITO: CERTO

Fonte: Livro Sistemas de Banco de Dados (Navathe)
Galera, copia e cola não ajuda muito aqui. Explicação simples e objetiva:
Clustering é basicamente uma técnica de agrupamento de dados.
Algoritmos particionais --> divide o sistema em partes lógicas
Algoritmos hierárquicos --> divide o sistema em partes, obedecendo uma hierarquia.
Pra quem está com dificuldade nas matérias suicidas da PF e PC-DF:
https://p.eduzz.com/420372?a=67541654
Não desanimem! Força e bons estudos!
Gabarito C
[x]Agrupamento (Clustering): a tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster) é uma coleção de registros similares entre si, mas diferentes dos outros registros nos demais agrupamentos. A partir dessa tarefa, é possível visualizar os padrões e descrevê-los.
K - mean (a) --------- mod (o) --------- medoid (i)
K - média (a) --------- moda (o) --------- mediana (i)
...
Então:
se tem A é médiA;
se tem O é mOda;
se tem I é medIana.
Clusterização - aprendizado NÃO supervisionado
Classificação - aprendizado supervisionado
CERTO

Em mineração de dados, agrupamento k-means é um método de Clustering que objetiva particionar n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média.

Fonte: wikipedia
Se serve de consolo: isso não vai cair mais.
Quem disse que não vai cair mais? Só se for na tua prova. Porque na PF eu tenho CERTEZA.
Nunca nem vi essas coisas nos pdfs e nas video aulas... se ferrar em
mole mole a questão
Isso aborda algoritmos dentro da parte de mineração. Já é muito mais avançado do que é cobrado pra PF.
Cebraspe em 2021: Medoid não é mediana.
APENAS Minha singela opinião: O mais importante aqui é entender o conceito do Clustering que está associado a AGREGAÇÃO. Em grosso modo é agrupar, particionar em segmentos (GRUPOS).

(QUESTÃO)O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. CERTO

É apenas esse conceito de Clustering que eu levaria para prova, depois para aprofundamento decorar os K - means = média, K - mods = moda , K - medoids = mediana
Agrupamento/Clustering k-means é um método de segregar em torno de centros (centroides) diversos dados, que gera o efeito de particionar n observações dentre k grupos, onde cada observação pertence ao grupo mais próximo da média. Isso resulta em uma divisão do espaço de dados em um Diagrama de Voronin.

FONTE: pt.wikipedia.org/wiki/K-means

Ou seja, agrupar é, obviamente, dividir em grupos. Depois de formados estes grupos, vamos pegar parte de cada um deles, como se fossem amostras. Sendo que essa "amostra" é, dentro do grupo, aquela mais próxima à média do grupo ao qual pertence.

OBS. Existe o k-mod (moda) e k-medoid (mediana). Ou seja, é a mesma coisa, só muda o parâmetro da amostra retirada.
Conforme comentário de @Arieuqis:
se tem A é médiA;
se tem O é mOda;
se tem I é medIana.
Do meu ponto de vista, a questão não é tão simples assim, pois permite interpretação ambígua em seu enunciado, principalmente para quem entende como o algoritmo funciona.

"O método de clustering k-means objetiva particionar “n” observações entre “k” grupos; cada observação pertence ao grupo mais próximo da média."

A qual média a questão se refere? À media de cada cluster ou à média geral do conjunto de dados?

Se cada observação pertencer à média de cada cluster, isto é, seu respectivo centroide, a questão está certa.

Porém, o enunciado não define a qual média se refere, ficando aberta a interpretação de que a questão pode se referir à média geral do conjunto de dados, o que tornaria a questão ERRADA.

Em determinados momentos, a banca parece exigir do candidato, além da preparação, uma boa dose de clarividência.

SóProvas

Continue usando...

O que está incluso