SóProvas


ID
1215169
Banca
CESPE / CEBRASPE
Órgão
TJ-SE
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, com relação a DataMining e ETL.

O processo de carga de um DataWarehouse consiste exclusivamente em adicionar novos dados históricos regularmente.

Alternativas
Comentários
  • Primeiro os dados devem passar por um processo de limpeza e integração (transformação), para que ai sim sejam carregados. Vejo três etapas então, ao invés de apenas inclusão.


    O processo de carga do Data Warehouse é uma operação efetuada por processo de carga/inserção específicos de cada DBMS ou por processos independentes de carga rápida (Fastload) - é a tecnologia que consegue tempos de carga significativamente mais rápidos através do pré-processamento dos dados e de dispensa das operações de verificação de integridade dos dados e de registro das operações efetuadas.  Esta tecnologia substitui uma função especifica de carga do DBMS.

    A carga dos dados será feita a partir de um sistema de banco de dados temporário, no qual os dados devem já ter passado por um processo de limpeza e integração (transformação). As tabelas que serão atualizadas no sistema de DW devem ser montadas utilizando-se agregações, sumarizações e ordenações dos dados.


    http://www.coladaweb.com/informatica/data-warehouse

  • "O processo de carga de um DataWarehouse consiste exclusivamente em adicionar novos dados históricos regularmente.": Acredito que o erro da questão está em afirmar que o processamento de carga (Load do RTL) ocorre regularmente. Na verdade, depende do negócio da organização, pode ser regularmente, pode não ser.


    Apostila do Estratégia Concursos:

    A fase de carga carrega os dados no Data Warehouse. Dependendo das necessidades da organização, este processo varia amplamente. Alguns data warehouses podem substituir as informações existentes semanalmente, com dados cumulativos e atualizados, ao passo que outro DW (ou até mesmo outras partes do mesmo DW, conhecidos como Data Marts) podem adicionar dados a cada hora. A temporização e o alcance de reposição ou acréscimo constituem opções de projeto estratégicas que dependem do tempo disponível e das necessidades de negócios. Sistemas mais complexos podem manter um histórico e uma pista de auditoria de todas as mudanças sofridas pelos dados. 

  • Realmente o erro está em afirmar que isso deve acontecer regularmente

  • " consiste exclusivamente em adicionar novos dados históricos"

    A palavra exlusivamente tornou a questão errada, pois o DW hoje incluem também dados atuais para que possam fornecer apoio ao processo de tomada de decisões em TEMPO REAL. 

  • heurística top para questões CESPE: viu algo radical? tipo "todas", "sempre", "nunca", "impossível", "exclusivamente" fique ALERTA!!! Só dê certo se conseguir justificar para si que TODAS afirmações estão certas dentro da questão

  • A questão dá a entender que a carga deve ocorrer regularmente, o que é falso! A carga pode ocorrer também sob demanda com frequências diversas - sem qualquer regularidade.


    Gabarito: Errado

  • Nishimura vive!

  • O processo de carga (ETL) não consiste em adicionar somente novos dados, há situações em que a base está limpa e leva de novo os mesmos dados históricos, porque pode ter ocorrido alterações.  

    Fonte: Prof. Maurício Franceschini