SóProvas


ID
2306050
Banca
CESPE / CEBRASPE
Órgão
SEDF
Ano
2017
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a data mining e data warehouse, julgue o item que se segue.

Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever conhecimento descoberto durante processos de mineração de dados.

Alternativas
Comentários
  • Se analisarmos a descrição acima temos uma definição da tarefa de agrupamento ou clustering. A clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo comalguma medida de similaridade. De forma intuitiva, padrões pertencentes a um dado cluster devem ser mais “similares” entre si do que em relação a padrões pertencentes a outros clusters.

    Vejam, portanto, que a alternativa está correta.

     

    Fonte: https://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-sedf-tecnologia-da-informacao-bd-e-bi/

  • Ele está falando da classificação de dados. Que é uma alternativa para obtenção de conhecimento. O agrupamento de dados similares. CORRETO
  • Trata-se de Clusterização / Agrupamento de Dados.  

     

    Paulo ☕, posso até estar enganado, mas acho que na classificação de dados as classes são predefinidas. No caso da questão, deseja-se agrupar registros em grupos com base em suas similaridades, ou seja, não existem classes predefinidas, como bem explica o comentário do Marco Aguiar.    

  • associação

    classificação

    agrupamento

     

    2016

    Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.

     

    2012

    Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados.

    Certa

     

  • CORRETO
    Agrupamento é uma das tarefas que podem ser realizadas pelos Data Mines. Ela é uma maneira de descrever conhecimento, mas não é a descoberta de conhecimento em si.

  • Descrever conhecimento é foda. 

  • CORRETO

     

    Pode ser por agrupamento K-means

  • CERTO

    Acredito que outra questão ajuda a responder essa.

     

    (2017/TCE-PE/Auditor) Em relação à análise de agrupamentos (clusterização) em mineração de dados, o método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. CERTO

  • Gabarito Certo


    Em data mining, na tarefa de Agrupamento (Clustering), o algoritmo de agrupamento tem como meta identificar semelhanças entre dados e dispor estes em grupos de acordo com o seu grau de similaridade. Com isto os dados ficam organizados em subconjuntos homogêneos, o que torna a visualização pelo usuário mais simples e compreensível.


  • Gab certo


    Tarefa de Agrupamento (Clustering) 

    O algoritmo de agrupamento tem como meta identificar semelhanças entre dados e dispor estes em grupos de acordo com o seu grau de similaridade. Com isto os dados ficam organizados em subconjuntos homogêneos, o que torna a visualização pelo usuário mais simples e compreensível.


  • Em data mining, na tarefa de Agrupamento (Clustering), o algoritmo de agrupamento tem como meta identificar semelhanças entre dados e dispor estes em grupos de acordo com o seu grau de similaridade. Com isto os dados ficam organizados em subconjuntos homogêneos, o que torna a visualização pelo usuário mais simples e compreensível.

     

    (2017/TCE-PE/Auditor) Em relação à análise de agrupamentos (clusterização) em mineração de dados, o método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. CERTO

     

  • Marquei errado por utilizar o termo conhecimento, acredito que o mais correto seria utilizar informação. O Data Mining fará o tratamento de dados para gerar informações que possam gerar conhecimento e valor para o usuário.  A informação se tornará conhecimento apenas se for útil ao usuário, o que não é garantido.

  • Se analisarmos a descrição acima temos uma definição da tarefa de agrupamento ou clustering. A clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo com alguma medida de similaridade. De forma intuitiva, padrões pertencentes a um dado cluster devem ser mais “similares” entre si do que em relação a padrões pertencentes a outros clusters.


    Vejam, portanto, que a alternativa está correta.

     

    Fonte: https://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-sedf-tecnologia-da-informacao-bd-e-bi/

  • O agrupamento ou clusterização junta registros semelhantes entre si e diferente dos presentes nos demais grupos. Essa é, realmente, uma técnica descritiva de mineração de dados, que permite descrever o conhecimento obtido em forma de um agrupamento de valores semelhantes. É importante que você se lembre que a clusterização é associada ao aprendizado de máquina não supervisionado, em que as classes em que os registros serão distribuídos não são conhecidas previamente.

  • SÓ NÃO ENTENDI A PARTE QUE FALA EM "conhecimento descoberto", ALGUÉM PODERIA EXPLICAR???

  • # CLUSTERIZAÇÃO -> PROCESSO QUE BASICAMENTE BUSCA AGRUPAR DADOS QUE POSSUEM ALGUMA SIMILARIDADE. O GRUPO DERIVADO DESTE PROCESSO PODE SER CHAMADO DE CLUSTER. A CLUSTERIZAÇÃO BUSCA PRINCIPALMENTE MELHORAR O ''DESEMPENHO'', SE É QUE PODEMOS CHAMAR ASSIM, DE UM BD.

  • DADOS > INFORMAÇÃO > CONHECIMENTO > INTELIGÊNCIA

    ======================

    Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever CONHECIMENTO descoberto durante processos de mineração de dados. (ERRADO)

    ======================

    Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever DADOS descobertos durante processos de mineração de dados. (CERTO)

    ======================

    ======================MAS... QUEM SOU EU NA FILA DO PÃO ?!?!?!

  • AGRUPAMENTO: Técnica de aprendizagem não-supervisionada. Encontra os grupos e os classifica de maneira automática.

    OBJETIVO: Colocar registros em grupos por semelhança e aproximação.

  • GABARITO: CERTO

    Assertiva refere-se a tarefa ou técnica de clusterização ou agrupamento.

    A análise de cluster é uma ferramenta de análise exploratória de dados para resolver problemas de classificação. O objetivo é classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters.

  • Descrever CONHECIMENTO foi pra acabar . Na prova eu erraria.

  • ESTATÍSTICA E TECNOLOGIA DA INFORMAÇÃO, CAMINHANDO LADO A LADO. SÃO ESSES GUERREIROS QUE CONSEGUEM TRAZER GRANDES AVANÇOS PARA A MEDICINA. UMA SALVA DE PALMAS *CLAC CLAC CLAC*

    #MOMENTOREFLEXÃO

  • Gab.: C

    A técnica de clusterização/ agrupamento é descritiva. Além disso, buscar agrupar elementos similares em um cluster. Dentro de uma população temos vários clusters.

    O conhecimento descoberto na clusterização se dá por esses agrupamentos. A forma de obter conhecimento baseada nessa técnica

  • CERTO

    Na descrição acima temos uma definição da tarefa de agrupamento ou clustering.

    clusterização é a classificação não-supervisionada de dados, formando agrupamentos ou clusters. Ela representa uma das principais etapas do processo de análise de dados denominada análise de clusters. A análise de clusters envolve, portanto, a organização de um conjunto de padrões (usualmente representados na forma de vetores de atributos ou pontos em um espaço multidimensional – espaço de atributos) em clusters, de acordo com alguma medida de similaridade.

  • Agrupamento (clustering/agregação): Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos. (Descritiva, não supervisionado, não utiliza classes previamente definidas)

  • "O objetivo do agrupamento é colocar registros em grupos, de modo que os registros em um grupo sejam semalhantes uns aos outros e diferentes dos registros em outros grupos. Os grupos constumam ser disjuntos." Navathe (2011,p .712)

  • Questão mal elaborada, "é uma maneira de descrever conhecimento descoberto" não há conhecimentos nesta fase, no máximo informações, construidas a partir dos dados organizados.

  • O melhor foi "agrupar registros em grupos", não é redundância?

  • CERTO

    Trata-se da técnica de Mineração de Dados -> Clustering (Agrupamento) 

    • Aprendizado Não supervisionado (ninguém ensina o algoritmo, as classes são criadas pelo próprio algoritmo)
    • coloca no mesmo grupo "objetos" similares -> vai observar o que tem similar e agrupar automaticamente (características comuns)

    ex: O algoritmo na Netflix vai agrupar os usuários que assistem séries de "terror", e ao lançar uma nova séria desse tipo, recomendará de imediato para esses usuários.

  • Gabarito: Correto.

    A ideia da clusterização é agrupar as observações (os registros) em grupos em que seus membros são semelhantes entre si e diferentes dos demais grupos. Enquanto na classificação nós já temos um conjunto predefinido de classes em que o sistema deve dividir as observações, na clusterização esses grupos são determinados pelo próprio algoritmo, então náo ha classes predefinidas

  • Gabarito certo.

    Data mining ou mineração de dados é um processo para extrair dados específicos de um grande banco de dados. Para isso, há algumas técnicas, sendo elas:

    1. -Regras de associação
    2. -Árvores de decisão
    3. -Redes neurais
    4. -Induções de regras
    5. -Análise de agrupamentos

    A análise de agrupamentos (clusterização) tem como objetivo classificar casos em grupos, de modo que seja forte a associação entre os dados do mesmo agrupamento e a associação seja fraca entre dados de diferentes agrupamentos.

  • Existem grupos que são semelhantes entre si e diferentes dos registros que estão em outros grupos, mas que se correlacionam e descrevem, a partir disso, um conhecimento (descrição de conhecimento) descoberto.