-
ETL é um processo que extrai, transforma e carrega dados de várias fontes para um data warehouse ou outro repositório de dados unificado.
ETL é frequentemente usado por uma organização para:
- Extrair dados de sistemas legados
- Limpar os dados para melhorar a qualidade dos dados e estabelecer consistência
- Carregar dados em um banco de dados de destino
Fonte: https://www.ibm.com/cloud/learn/etl
-
Imagine do maior ao menor:
Big Data tem uma grande quantidade de dados ( Depois de coletar os dados o ... )
Data mining faz a mineração/propecção dos dados a procura de identificar padrões dentro do Big Data e...
Data Warehouse armazena os dados " limpos " depois da Extração, Transformação e Carregamento/Load ( ETL ) do Data Mining ( Como acessar? próximo passo )
Usa-se a ferramenta OLAP para explorar os dados ( já limpos ) do Data WareHouse.
Não aprofundei os conceitos, porém dessa forma você entende melhor o processo até chegar no OLAP.
Espero ter ajudado.
" Nós vamos conseguir, Valeu ! "
-
Questão que precisa ter alguns conceitos de ETL
Destaco os mais importantes:
O que é um ETL ? Extração, Transformação, Carregamento
Todas os dados estão entre origem e DW
Extração: copia os dados necessários da origem
Transformação: limpeza dos dados.
Carga: Estruturação física (fato e dimensão) e carregamento em modelo multidimensional.
Gabarito B