SóProvas


ID
4864036
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de conceitos, premissas e aplicações de big data, julgue o item subsequente.


No processo de agrupamento, o objeto denominado medoide é aquele que representa a mediana do grupo do conjunto. 

Alternativas
Comentários
  • Gab.: Errado

    k-Means (k-Médias) 

    A partir de um parâmetro de entrada k, divide-se o conjunto de n objetos em k grupos, com alta similaridade intragrupo e baixa similaridade intergrupos, sendo agrupados em volta do valor médio dos objetos do grupo, chamado de centroide. 

    k-Medoids (k-Medóides) 

    Os objetos são agrupados em torno do objeto com a menor dissimilaridade média a todos os outros objetos do grupo, sendo esse objeto denominado medóide. Parecido com do k-médias, diferencia deste por utilizar um objeto existente da base de dados como centro, dessa forma é mais robusto a ruídos e a valores discrepantes. 

    Fuzzy k-Médias 

    É uma extensão do k-médias, sendo que neste caso cada objeto possui um grau de pertinência a todos os grupos da base, podendo pertencer a mais de um grupo, com variados graus de pertinência.

  • nada de errado nessa questão, ninguém recorreu? essa e aquela dos índices secundários eu ia dar recurso fácil se tivesse prestado

  • De acordo com o professor do Exponencial Ramon Souza a questão cabe recurso e está CORRETA.

    Comentário: medoide (k-medoid) é o elemento que representa a mediana no grupo.

    Nesse contexto, o k-means representa a média e o k-mode representa a moda.

    AGUARDAR O GABARITO DEFINITIVO DO CESPE...

    AGREGANDO...

    O K- medoids foi proposto em KAUFFMAN & ROUSSEEUW (2005), onde os clusters são representados usando a mediana dos dados em vez da média.

  • Acabou que o gabarito definitivo da CESPE ficou como ERRADO.

    Alguém saberia me explicar o que representaria então esse "medoide"?

  • Errada? Oxeeee... por que?

    Alguém sabe qual foi a justificativa dada pelo Cespe para alterar o gabarito dessa questão?

    A análise de clusters pode ser baseada em métodos estatísticos como o k-means (média),

    k-modes (moda), k-medoids (mediana – valor mais ao centro do conjunto de dados)

  • Isso cai na PF e PCDF ? Nunca vi esses nomes nos PDF do estratégia.

  • Professor foi dar o buraco do amor? Cadê o gabarito? Bora trabalhar.

  • A Cespe ficou com Medoide de mudar o gabarito

  • Representa a MÉDIA!!!

  • Gaba: ERRADO

    Comentários: creio que o erro esta na descrição do medoids(mediana).

    "No processo de agrupamento, o objeto denominado medoide é aquele que representa a mediana do grupo do conjunto."

    O método de agrupamento não-hierárquico conhecido é o k-medoides (kmedoids).

    Sua estrutura e seu funcionamento são bem similares ao k-médias, o que os diferenciam é que enquanto no k-médias o centroide não precisa pertencer ao conjunto de dados, no k-medoides o centro é um dos pontos do conjunto, denominado medóide (DONI,2004). 

  • errado. Quem faz isso é o K-MODE

  • Alex Suita, tem no material para a PRF
  • Medoide não é a mediana, nem a média. É um objeto selecionado que servirá de centro para formação do agrupamento.

    "Diferentemente do método k-means, o método dos k-medoids não utiliza a média como centro do grupo, e sim, considera um problema onde um objeto é o centro do próprio grupo, chamado de objeto representativo ou medoid. A estratégia básica para definir k grupos para alocar os n elementos está diretamente associada à determinação do medoid para cada grupo. Inicialmente, selecionam-se de forma aleatória k objetos, medoids iniciais em cada um dos grupos. " fonte:http://abricom.org.br/wp-content/uploads/2016/03/st_10.6.pdf

    Além disso no wikipédia tem:

    "Note that a medoid is not equivalent to a median, a geometric median, or centroid. A median is only defined on 1-dimensional data, and it only minimizes dissimilarity to other points for metrics induced by a norm (such as the Manhattan or Euclidean distance). A geometric median is defined in any dimension, but is not necessarily a point from within the original dataset."

    Basicamente diz que medoide não é equivalente a mediana, pois a mediana só funciona para dados unidimensionais. A medoide pode ser usada pra agrupamento de modelos 3D (3 dimensões) também.

    Espero ter ajudado.

  • Objeto que se encontra mais próximo ao centro de gravidade do cluster (abordagem é conhecida como k-medoids), sendo o elemento mais próximo ao centro chamado de medoid.

    Gab: Errado!

  • Essa é aquela questão que quem errou, acertou.

  • ERRADO (Tentando entender)

    1. Ou utiliza-se a média dos objetos que pertencem ao cluster em questão, também chamada de centro de gravidade do cluster (k-means);
    2. Ou escolhe-se como representante o objeto que se encontra mais próximo ao centro de gravidade do cluster (k-medoids), sendo o elemento mais próximo ao centro chamado de medoid.
    3. O K- medoids foi proposto em KAUFFMAN & ROUSSEEUW (2005), onde os clusters são representados usando a mediana dos dados em vez da média

    • Os clausters no k-medoids são representados pela mediana, mas o elemento chamado de medoid é o mais próximo ao centro, não necessariamente a mediana, talvez possa ser esse detalhe.

    https://www.maxwell.vrac.puc-rio.br/24787/24787_5.PDF

    "A disciplina é a maior tutora que o sonhador pode ter, pois ela transforma o sonho em realidade."

  • Até aqui, na tentativa de entender essa questão, obtive uma explicação no artigo '''Brazilian Congress on Computational Intelligence (CBIC’2011), November 8 to 11, 2011, Fortaleza, Ceará Brazil © Brazilian Society on Computational Intelligence (SBIC).''

    Basicamente esse artigo diz: método dos k-medoids não utiliza a média como centro do grupo, e sim, considera um problema onde um objeto é o centro do próprio grupo, chamado de objeto representativo ou medoid.

    OBS: ESSE TIPO DE QUESTÃO A DEPENDER DO CONCURSO É UMA EXCEÇÃO, NÃO PERCA TEMPO BRIGANDO COM O GABARITO DO CESPE.

    COMO DIZ O DITADO POPULAR: ''ACEITA QUE DOI MENOS!”

    GABARITO DO CESPE ERRADO.

  • É o seguinte, pra encontrar uma determinada informação em uma big data, seleciona-se dados especificos de determinado grupo (clusters) pra representar os demais. Pra isso temos dois metodos:

    -> K-means: nesse, basicamente tira a media de todos os pontos (dados) do grupo e acha aquele que chamo de protagonista (centroide), aquele que vai representar momentaneamente os demais. Aqui, o objetivo é minimizar a distância quadrada entre os pontos e o centroide. Esse é o mais mais utilizado, por ser mais simples

    -> K-medoid: nesse caso, se observa ponto a ponto, a distância de um ponto em relação a todos os outros, encontrando aquele que ta mais proximo de todos do grupo. O objetivo é minimizar a distância absoluta entre os pontos e o centroide. Esse metodo tem um algoritmo beeeemm complexo, que não necessariamente vai encontrar sempre a mediana do grupo, afinal um cadidato a centroide pode puxar um ponto de outro grupo pra seu grupo pela proximidade a depender da situação

  • Não entendi nada...

  • SE EU ERRAR UMA QUESTÃO DESSA, EU METEREIA UM RECURSO NA QUESTÃO

    PORQUE O CERTO E MEDOID E NÃO METOIDE.....kkkkk

  • Medoids são objetos representativos de um conjunto de dados ou um cluster dentro de um conjunto de dados

  • Se nem o CEBRASPE sabe, por que haveria eu de me meter nisso?

  • FIQUEI COM MEDOID DESSA QUESTÃO

  • Há duas possibilidades na escolha do “elemento” que vai representar o centro do cluster, e que será a referência para o cálculo da medida de similaridade. Ou utiliza-se a média dos objetos que pertencem ao cluster em questão, também chamada de centro de gravidade do cluster (esta é a abordagem conhecida como k-means); ou escolhe-se como representante o objeto que se encontra mais próximo ao centro de gravidade do cluster (abordagem é conhecida como k-medoids), sendo o elemento mais próximo ao centro chamado de medoid.

  • na prova da PF irei vestido de branco, já saberão o porquê.

  • ERRADA

    • No processo de agrupamento, o objeto denominado k-means é aquele que representa a mediana do grupo do conjunto.
    • No processo de agrupamento, o objeto denominado medoide é um objeto selecionado que servirá de centro para formação do agrupamento..

    o   TÉCNICAS DE AGRUPAMENTO, ASSOCIAÇÃO E SUMARIZAÇÃO. Não supervisionado

    ü Método k-means, utiliza a média como centro do grupo;

    ü Método dos k-medoids não utiliza a média como centro do grupo, considera um problema onde um objeto é o centro do próprio grupo. Medoide não é a mediana, nem a média. É um objeto selecionado (representativo ou medoid) que servirá de centro para formação do agrupamento.

  • Errada

    • K-Medians = mediana
    • K-Means = média
    • K-Medoid = ponto médio real do conjunto de dados
  • Existem dois modelos relativos à agrupamentos em mineração de dados:

    a) Hierárquico: os dados são dispostos naqueles diagramas de árvore (semelhantes à organização e hierarquia dos exploradores de arquivos do windows e do Linux)

    b) Não-Hierárquico: são divididos em dois:

    b1)K-means: é considerado um conjunto de dados dispostos de forma não-hierárquica(X1,X2,X3...Xn). É atribuído K centróides (C1,C2,C3...Ck) anteriormente. Para cada conjunto de dados X, será atribuído um centróide que minimize a distância entre o C e o grupo de X. Esse centro, no plano cartesiano, é o centro de massa. O centro de massa se relaciona com a média.

    b2)K-medóides: é muito parecido com o K-means, mas os K centróides fazem parte dos próprios dados. É como se escolhesse um para ser o centróide de cada grupo e a partir daí agrupam-se os dados em torno desse valor escolhido. É buscado também o centro de massa, que não se relaciona com a mediana, mas com a média.

    https://www2.ufrb.edu.br/bcet/components/com_chronoforms5/chronoforms/uploads/tcc/20190604200511_2018.2_TCC_Luann_Farias_Palma-_Agrupamento_de_dados_-_K_medias.pdf

  • O professor do QC também ficou com Medóide de responder essa questão

  • Um erro comum quando se trabalha com a mediana é confundir seu conceito com o de medóide.

    Ambos buscam minimizar o erro em relação aos dados, porém enquanto que a mediana é um ponto adicional calculado a partir dos dados que temos e não necessariamente igual a algum dos dados, o medóide é um ponto adicional que será igual a algum dos dados.

    No caso do medóide, selecionamos o ponto que minimize o erro em relação a todos os pontos, enquanto que no caso da mediana selecionamos medianas de atributos para minimizar o erro.

    http://www.repositorio.ufc.br/bitstream/riufc/21491/1/2015_dis_ffrdamasceno.pdf

  • Quem acertou, errou. Quem errou, acertou.

  • Achei que eu estivesse na minha aula de Anatomia Sistêmica....

  • errei ela né, ai estudei voltei e errei de novo, daí eu voltei a estudar ,ENTÃO, Errei ela de novo =)

  • Com TODA certeza, deixaria sr.

    Nem o examinador sabe o que cobrou, imagine eu, mero mortal.

    Bora que está chegando.

    DEUS nos abençoe!

  • Assistir uma vídeo aula do Professor Léo Matos na qual ele falou que o medoide refere-se ao cálculo de distância Euclidiana.

  • Medoids são objetos representativos de um conjunto de dados ou um cluster dentro de um conjunto de dados cuja dissimilaridade média para todos os objetos no cluster é mínima. [1] Os medóides são semelhantes em conceito a meios ou centróides, mas os medóides são sempre restritos a serem membros do conjunto de dados. Medoids são mais comumente usados ​​em dados quando uma média ou centróide não pode ser definido, como gráficos. Eles também são usados ​​em contextos onde o centróide não é representativo do conjunto de dados, como em imagens e trajetórias 3-D e expressão gênica [2] (onde enquanto os dados são esparsos, o medóide não precisa ser). Eles também são de interesse quando se deseja encontrar um representante usando alguma distância diferente da distância euclidiana quadrada (por exemplo, em classificações de filmes).

    Para alguns conjuntos de dados, pode haver mais de um medóide, como ocorre com as medianas. Uma aplicação comum do medóide é o algoritmo de agrupamento k-medoides, que é semelhante ao algoritmo k-médias, mas funciona quando uma média ou centróide não é definível. Este algoritmo funciona basicamente da seguinte maneira. Primeiro, um conjunto de medoides é escolhido aleatoriamente. Em segundo lugar, as distâncias para os outros pontos são calculadas. Terceiro, os dados são agrupados de acordo com o medóide ao qual são mais semelhantes. Quarto, o conjunto medóide é otimizado por meio de um processo iterativo.

    Observe que um medóide não é equivalente a uma mediana, uma mediana geométrica ou um centróide. Uma mediana é definida apenas em dados unidimensionais e apenas minimiza a dissimilaridade de outros pontos para métricas induzidas por uma norma (como a distância de Manhattan ou distância euclidiana). Uma mediana geométrica é definida em qualquer dimensão, mas não é necessariamente um ponto de dentro do conjunto de dados original.

    Amigos, texto original em: https://en.wikipedia.org/wiki/Medoid

  • Nem se eu tivesse acesso ao google na hora da prova...Pesquisei aqui e ele não me retornou nada... :(

  • Típica questão pra exercer o meu direito de deixar algumas em branco.

  • Medoide é aquele que representa a mediana do grupo do conjunto. CORRETO

    Justificativa do gabarito estar como ERRADO:

    A CESPE é contratada com dispensa de licitação e precisa manter isso para abraçar vários outros certames, o órgão contratante (Ministério da Economia) sempre indica à CESPE alguns "apadrinhados" que devem ser aprovados, então como a maioria destes apadrinhados colocou ERRADO na prova o gabarito oficial teve que vim ERRADO mesmo.

    TODA PROVA DE CERTO/ERRADO DA CESPE É FEITA PARA BENEFICIAR APADRINHADOS.

  • desanima gabaritos sem nexo , porém, isso e um fator pra fazer vcs desistirem, achar que não e pra vcs.

    Segue o baile, so saio depois de nomeado.