SóProvas


ID
513595
Banca
FMP Concursos
Órgão
TCE-RS
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Qual das assertivas a seguir melhor corresponde aos conceitos ou técnicas de mineração de dados?

Alternativas
Comentários
  • KDD - knowledge discovery in database( Descoberta (Busca) de Conhecimento em Banco de Dados) é um processo que engloba seis fases:
    seleção dos dados; (levantamento de itens especificos ou categorias de itens)
    limpeza;(eliminação de erros)
    enriquecimento; (incremento dos dados)
    transformação ou codificação;( executada para reduzir a quantidade de dados)
    data mining;
    construção de relárorios e apresentação da infromação descoberta;

    Portanto
    a) errada. nada tem a ver com o contexto de data mining que são baseados em data warehouses

    b) correta de acordo com a definição acima

    c)????viagem para gerar confusão

    d)CONTROVERSA - Segundo Bill Immon em Building the Data Warehouse todo dataware house nececessita ser integrado e a limpeza dos dados é tambem um requisito inicial dos DW. Como data mining são baseados em DW, conclui-se que esses passos já tenham sido aplicados no processo de mineração.

    e)errada. Tecnicas de mineração - regras de associação,hierarquias de classificação,padrões sequenciais,padrões com series temporais e clustering(agrupamento/agregação) .
    Portanto agregação errada e representação por gráficos diversos correta

    Questão dificil na minha opinião e  poderia ser alvo de um recurso melhor elaborado.
  • Concordo com o Haroldo, pois no meu entendimento a questão D esta correta também.
  • Amigos, o Data Mining não dependo do DW. Não confundam.
    O Data Mining Aliada ao DW possui um desempenho melhor, entretanto O Data Mining pode ser aplicado a Bancos de Dados convencionais.
  • "Limpeza, integração, seleção e transformação de dados, etapas fundamentais para o sucesso da mineração"

    ftp://ftp.inf.puc-rio.br/pub/docs/techreports/02_10_cortes.pdf


    DW ou não, ainda não entendi o porque não pode ser a letra D.
  • Questão difícil mesmo.
    Acredito que a solução esteja nos detalhes.

    D - errada.  Por que a limpeza e integração não são "sequencialmente" os passos iniciais.

    E - errada. Porque representação por gráficos diversos não é uma técnica.

    Muito confusa assim mesmo.
  • Concordo com o pessoal que a questão é confusa, mas o pensamento que tive ao descartar o item "d" é o seguinte:

    A mineração necessita de dados homogênios (tratados), porém esta função não faz parte das atividades de mineração. Pode ser de um BD (que possui dados homogênios devido suas regras de integridade) ou de um DW (homogênio pela ETL). A limpeza e integração são necessárias mas não são passos iniciais e sim ANTERIORES ao processo de integração.
    Estaria certa se fosse:

    d) A limpeza e integração dos dados no banco de dados são os passos anteriores ao processo de mineração.
  • A definição mais aceita do data mining é a identificação de padroes atraves da analise dos dados. A limpeza é realmente o 1° passoem data mining para avaliar as fontes de dados para verificar redundancia e inconsistencia na informação, originando repositorios mais especializados como data marts.

  • Gabarito B.

    Mineração de Dados é parte de um processo maior de pesquisa chamado de Busca de Conhecimento em Banco de Dados (KDD).

  • Limpeza faz parte do pré-processamento(segunda fase do KDD, mineração é encontrada na fase 4).

    • KDD (Knowledge Discovery in Databases – Descoberta de Conhecimentos em BD).

    Sou Policial e Também Dou Instrução

    1) Seleção

    2)  Pré-processamento

    3)  Transformação

    4)  Data Mining

    5)  Interpretação e Avaliação 

    fonte: qc e estratégia

  • Letra B

    A Mineração de Dados (Data Mining) é um SUBCONJUNTO do KDD

    Fases do KDD:

    (1) Seleção de dados: seleciona um conjunto de dados para serem ANALISADOS (estruturados, semi-estruturados, não-estruturados)

    (2) Pré-processamento (limpeza): eliminar ruídos, tuplas vazias, corrigir ou remover dados inconsistentes, identificar anomalias (outliers).

    (3) Transformação dos dados: transformação dos dados utilizando métodos como: Normalização, Agregação, Criação de novos atributos, e Sintetização dos dados.

    (4) Mineração de dados (data mining): é a fase MAIS importante do processo de KDD. Aplicam-se técnicas para extrair informações a partir de um grande volume de dados e transforma essas informações em conhecimento útil.

    (5) Interpretação / Avaliação: interpreta e avalia os padrões extraídos na etapa de Mineração de dados. (podendo retornar a qualquer fase anterior caso seja necessário)