SóProvas


ID
917131
Banca
ESAF
Órgão
MF
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

A Mineração de Dados requer uma adequação prévia dos dados através de técnicas de pré-processamento. Entre elas estão as seguintes técnicas:

Alternativas
Comentários
  • FONTE:http://www.itnerante.com.br/profiles/blogs/coment-rio-prova-stn-2013-esaf-quest-es-de-bd-bi-infra-estrutura

    Essa questão não mede o grau conhecimento do candidato e sim a sua capacidade de decorar uma lista, que cada dia cresce mais, de técnicas de datamining, mas precisamente das técnicas de pré-processamento. A lista foi retirada do livro do TAN. Veja abaixo a lista em inglês, uma tradução ao pé da letra encontra-se na alternativa E,na mesma ordem apresentada.

    AggregationSamplingDimensionality ReductionFeature subset selectionFeature creationDiscretization and BinarizationAttribute Transformation

  • Gabarito: E.

    Técnicas de Pré-Processamento:

    Agregação: Combina dois ou mais atributos (ou objetos) em um único atributo (ou objeto) com a finalidade de reduzir o número de atributos ou objetos, alterar escalas e tornar os dados mais estáveis.

    Amostragem: O princípio básico é: usar uma amostra funciona tão bem quanto usar o conjunto completo de dados, se a amostra for representativa. Ela é representativa se tiver aproximadamente as mesmas propriedades de interesse do conjunto inicial.

    Redução de Dimensionalidade: Essa técnica reduz a quantidade de tempo e memória necessárias pelos algoritmos de mineração de dados, permitindo que os dados sejam mais facilmente visualizados e ajudando a eliminar características irrelevantes.

    Seleção de Subconjuntos de Recursos: Trata-se de outra forma de reduzir a dimensionalidade dos dados, buscando eliminar características redundantes ou irrelevantes por meio de diversas abordagens diferentes.

    Criação de Recursos: Essa técnica busca criar novos atributos que podem capturar informação importante em um conjunto de dados muito mais eficientemente que os atributos originais.

    Binarização e Discretização: Técnica que busca transformar dados para um formato de atributos binários ou discretos.

    Transformação de Variáveis: Essa técnica busca melhorar a eficiência de algoritmos de classificação envolvendo redes neurais e auxiliar técnicas estatísticas que se baseiam na suposição da normalidade dos dados.

    Fonte: Minhas anotações.

    Bons estudos!