-
Gabarito: CORRETA
Na questão foi alterado a ordem, mas foi considerada correta.
ETL, na prática, são ferramentas de software cuja função é a extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e, por fim, a carga dos dados em um Data Mart ou um Data Warehouse.
-
foi alterado a ordem mas ele não disse (nessa ordem)
correta
-
A etapa de extração do módulo de ETL de um sistema de Business Intelligence se dedica a coletar dados de diversas fontes para posterior transformação e carregamento na base de destino. Você pode ter achado que a assertiva estava errada por dizer que são coletadas informações de diferentes fontes, mas a questão foi considerada correta.
Acontece que as bancas não costumam focar muito nesse aspecto formal da diferença entre dado, informação e conhecimento em questões que não dizem respeito a esse assunto. Então, minha recomendação é: a não ser que a questão trate explicitamente da diferença entre esses conceitos ou o erro seja muito óbvio, você pode considerar a diferença como sendo irrelevante para a resposta.
-
ETL faz a coleta em todo e qualquer tipo de dado na Origem,
-
ETL é o processo mais crítico e demorado na construção de um Data Warehouse, uma vez que
consiste na extração dos dados de fontes homogêneas ou heterogêneas; na transformação e
limpeza destes dados; e na carga dos dados no DW. Pessoal, as decisões estratégicas – aquelas
mais importantes de uma organização – são tomadas com base nas informações geradas através
dos dados armazenados no Data Warehouse.
-
A técnica denominada ETL extrai dados de diversas fontes - homogêneos e/ou heterogêneos, dados estruturados e não estruturados.
-
GABARITO CORRETO!
.
.
ACRESCENTANDO:
Existem três tipos primários de paralelismos implementados em aplicações de ETL:
Dados: Pela divisão de um único arquivo sequencial em arquivos de dados menores para permitir acesso em paralelo.
Pipeline: Permitindo a execução simultânea de diversos componentes no mesmo fluxo de dados.
Um exemplo seria a leitura de um valor no registro 1 e ao mesmo tempo juntar dois campos no registro 2.
Componente: A execução simultânea de múltiplos processos em diferentes fluxos de dados no mesmo job. A classificação de um arquivo de entrada concomitantemente com a de duplicação de outro arquivo seria um exemplo de um paralelismo de componentes.