SóProvas


ID
190732
Banca
CESGRANRIO
Órgão
ELETROBRAS
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Os dados transacionais de uma grande empresa estão dispostos em bases heterogêneas. Para que dados carregados no data warehouse sejam considerados adequados à formação de tabelas fato e dimensionais, a etapa de transformação pode realizar procedimentos de limpeza nesses dados.
Que problema NÃO é resolvido por esse tipo de procedimento?

Alternativas
Comentários
  • "(...)a etapa de transformação pode realizar procedimentos de limpeza nesses dados(...)"

    A questão fala da limpeza dos dados. Essa etapa do ETL - extract, transform, load (extrair, transformar e carregar) - de limpeza dos dados ocorre depois da extração dos mesmos. Na limpeza dos dados, verifica-se existência de valores não previstos (alguns valores podem não ter correspondência no data warehouse), ausência de dados, ou seja, não há dados correspondentes a algumas colunas no data warehouse, forçando a geração de valores default, inconsistência de dados, como chaves estrangeiras sem correspondências, duplicação de dados e etc. Porém, a filtragem de dados a serem carregados é feita antes, na fase de extract. Primeiro se extrai os dados, escolhendo, filtrando o que se deseja. Depois, faz-se a limpeza dos mesmos.

    Alternativa B.
  • Segundo Tanenbaum, a única coisa que não tem solução na Computação é não ter bits o suficiente para resolver o problema.

    Se a petrobrás, que vai buscar óleo  quase no magma diz que algo não pode ser feito então só pode ter alguma pegadinha,

    Aqui no Livro de Siberschartz diz que quando se obtem dados de diversas fontes, esses dados podem vir com pequenas inconsistências, que pode ser erros de digitação, ou informações duplicadas e contraditórias. Campos como endereço ( rua, bairro, cidade) ou cep, podem ter sído informados incorretamente.

    Dados ausentes, como por exemplo o CEP, tendo-se a rua e o bairro do registro, pode-se inferir o cep.

    As duplicações de dados são resolvidas por uma operação chamada merge-purge.

    Para os valores não previstos pode-se utilizar uma pesquisa difusa.

    Porém "Filtragem de dados a serem carregados" refere-se à etapa de load - carga dos dados no depósito.