SóProvas


ID
236344
Banca
FCC
Órgão
TCE-SP
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Considere uma dada população de eventos ou novos itens que podem ser particionados (segmentados) em conjuntos de elementos similares, tal como, por exemplo, uma população de dados sobre uma doença que pode ser dividida em grupos baseados na similaridade dos efeitos colaterias produzidos. Como um dos modos de descrever o conhecimento descoberto durante a data mining este é chamado de

Alternativas
Comentários
  • Uma das técnicas estatísticas utilizadas em  Data Mining é Clustering  (Análise de Cluster,
    ou agrupamentos).  Clustering é um ramo da Estatística Multivariada que engloba
    métodos utilizados para descobrir estruturas em um conjunto complexo de dados. O
    objetivo principal de  clustering é separar objetos ou observações em classes naturais de
    forma que os elementos pertencentes a um mesmo grupo tenham um alto grau de
    semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos
    distintos, tenham pouca semelhança entre si (Andeberg, 1973).
    O atrativo dos métodos de  clustering para tarefas de mineração de dados é a sua
    habilidade de extrair estruturas diretamente dos dados, sem nenhum conhecimento
    prévio. Métodos de  clustering para  Data Mining, são utilizados com modificações em
    relação aos algoritmos tradicionais, sobretudo visando aumentar sua eficiência, diante
    da quantidade de objetos a serem classificados no contexto de  Data Mining (Ng e Han,
    1994) (Koperski, et al., 1997) (Zhang et al., 2001).
  • O maravilha mais uma questão retirada literalmente de uma bibliografia consagrada

    Vamos lá:
    "Clustering(Agrupando) - uma dada população de eventos ou novos itens particonados(segmentados) em conjunto de elementos 'similares' . Exemplos:(1) \uma população de dados sobre o tratamento de uma doença pode ser dividida em grupos baseados na similiaridade dos efeitos colaterais produzidos.(...)" - Sistemas de banco de Dados - Elmasri e Navathe 4ª ed pag 627

    Fácil para quem estudou pelo livro e fez seu "bizurado" resumo

    Vamos a oração do concurseiro de TI

    "Senhor me dê sabedoria para descobrir o material correto a ser estudado,
    recursos para adquiri-los
    paciencia para estuda-los
    Tire de mim toda a vontade de pesquisar no Goggle
    e me mantenha firme nas bibliografias corretas

    Amém"

  • Apenas para complementar...  A diferença entre "cluestering" e "classificação":

    - Agregação(ou clustering ou agrupamento) consiste na busca de similaridades entre os dados tal que permita definir um conjunto finito de classes ou categorias que os contenha e os descreva. A principal diferença entre esta abordagem e classificação é que em agregação não se tem conhecimento prévio sobre o número de classes possíveis nem a possível pertinência dos exemplos usados na modelagem. Descobrir grupos homogêneos de clientes é uma das possíveis aplicações e pode ser usada para ajudar na definição da estratégia de marketing a ser adotada.
  • Gostei da oração kkkkkkkk

  • Realmente, fiquei na dúvida entre classificação e clustering.

    Apesar de ter estudado o data mining pelo livro do Elmasri, eu aprendi somente o conceito de classificação e agrupamento (clustering), sabendo diferenciar que no caso do agrupamento (clustering) as classificações são feitas de forma automática, também chamada de classificação não supervisionada. Em outras palavras, não se tem conhecimento prévio dos grupos possíveis de classificação e o próprio mining através do agrupamento realiza a classificação sozinho.

    Em nenhum momento eu li na questão as palavras-chaves: segmentação automática, segmentação não supervisionada, segmentação sem conhecimento prévio...

    Portanto, continuo entendendo que a resposta correta dessa questão seja a letra c) classificação.

  • Letra D

     

    Palavras-Chaves para ajudar na resposta:


    Classificação = CLASSE, CATEGORIA, CATEGORIZAR
    Estimação = USO DE VALORES NÚMERICOS, ESTIMAR VALOR
    Predição = MAPEAMENTO de valores ASSOCIADOS aos dados
    Clustering = APROXIMAR REGISTROS SIMILARES
    Associação = ATRIBUTOS RELACIONADOS

  • Análise de Clusters (Agrupamentos)
    • Consiste em identificar agrupamentos de objetos, estes que identificam uma classe.
    • Trabalha sobre dados onde as etiquetas das classes não estão definidas.
    • Conhecido também por aprendizado não supervisionado e, às vezes, chamado de classificação por estatísticos e de segmentação por pessoas de marketing.

     

    Tipos de Agrupamento
    • Algoritmos Particionais:
    – Construir diversas partições e avaliá-las com algum critério
    • Algoritmos Hierárquicos:
    – Criar uma decomposição hierárquica de um conjunto de objetos utilizando algum critério

     

    Fonte: Itnerante

  • A técnica da mineração de dados que divide os elementos de dados em grupos de acordo com sua similaridade é a clusterização, também conhecida como análise de agrupamentos ou de conglomerados. É uma técnica relacionada ao aprendizado não supervisionado e seus grupos não são definidos a priori.

    Gabarito: D

  • Falou em divisão em grupos similares, marca clusterização sem medo.

  • O enunciado não deixa claro se as classes de mapeamento são pré ou pós definidas. Mas como é literal do livro-base do assunto, não tem o que discutir. Imagino eu que, no livro, esteja melhor contextualizado o parágrafo.