-
ETL - (Extract - Transform - Load)
Possui conexões com fontes de dados que podem ser heterogêneas e geograficamente dispersas; processos de extração que irão, através da conexão, copiar dados destas fontes; um processo de arquivamento que conservará dados em disco temporariamente para a etapa seguinte e, finalmente, os procedimentos de transformação e o arquivamento que carrega os dados na sua fonte definitiva.
Significa
➨ Extrair
➨ Limpar
➨ Preparar
➨ Entregar
Método mais comum para transferir dados de uma fonte de dados OLTP para um data warehouse.
Tarefas
➨ Filtragem
➨ Integração
➨ Conversão
➨ Condensação
A derivação dos dados de entrada podem ser originários de diversas fontes como por exemplo OLTP .
Certo
Introdução à Ciencia de Dados: mineração de dados e big data - Amaral, Fernando
-
Gab: CERTO
O processo de ETL se resume basicamente em 5 passos: 1. Identificação da origem dos dados a serem coletados, sendo que as fontes podem estar espalhadas em diversos sistemas transacionais e banco de dados da organização; 2. Realizar a limpeza dos dados para possibilitar posterior transformação, e nesta etapa ocorre os ajustes nos dados, com o intuito de corrigir imperfeições com o objetivo de oferecer um melhor resultado para o usuário final; 3. A terceira etapa é de transformação dos dados e tem por objetivo fazer a padronização dos dados em um único formato; 4. A fase seguinte é de carga dos dados para o Data Warehouse; 5. Por fim, existe a etapa de atualização dos dados no DW (refresh), realizada a partir das alterações sofridas pelos dados nos sistemas operacionais da organização.
-
ETL -> extração
-> Transformação
-> Carga
-
Dados heterogêneos são aqueles dados de tipos diferentes, em contraste com os dados homogêneos, que são aqueles dados de tipos iguais. Uma Ferramenta ETL realmente é capaz de extrair dados de fontes heterogêneas (ou homogêneas), copiá-los para uma área de transição (conhecida como Stage Area), onde possam ser convertidos (ou transformados) conforme o padrão estabelecido e, ainda, realizar limpeza e correção nos dados, de acordo com regras preestabelecidas.
Gabarito: Correto
Fonte: estratégia
-
Certo
O sistema Extract-Transform-Load (ETL) é a base para construção de um data warehouse. Quando projetado adequadamente um sistema ETL extrai dados dos sistemas de origem, reforça a qualidade dos dados e padrões de consistência, ajusta dados para que dados advindos de fontes distintas possam ser usados juntos e finalmente entrega dados em um formato pronto para apresentação.
A principal função da integração de dados ou ETL é obter dados de onde eles residem atualmente, alterando-os para que sejam compatíveis com o formato desejado e colocando-os no sistema de destino. Essas três etapas são chamadas de extrair, transformar e carregar (ETL). Toda a integração de dados, independentemente de ser executada em lote (batch) ou em tempo real, de forma síncrona ou assíncrona, física ou virtualmente, gira em torno dessas ações básicas.
O ETL é responsável pela extração, transformação e carga dos dados das bases operacionais para a base de dados analítico.
O processo de ETL é composto por algumas fases, extrair, limpar, preparar e entregar.
No processo de ETL mostrado na figura, I e II correspondem, respectivamente, a: Staging Area e Data Warehouse.
-
CERTO
ETL, do inglês Extract Transform Load (Extrair Transformar Carregar), são ferramentas de software cuja função é a extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e por fim o carregamento dos dados geralmente para um Data Mart e/ou Data Warehouse, porém nada impede que também seja para enviar os dados para um determinado sistema da organização.
-
gab.: CERTO.
Um DW coleta dados de diversas fontes (internas e externas), esses dados podem ser estruturados ou não. Após a coleta esses dados passam por uma área de preparo (Staging Area) e acontece o ETL (extract (extrair) ➟ transform(transformar) ➟ load (carregar).
FONTE: Prof.Hachid
-
Gabarito: certo
Questão linda!!
FONTES DE DADOS HETEROGÊNEAS ( entrada para um EDW) ---> PROCESSO DE ETL ( primeiro seleciona e depois extrai as informações necessárias colocando na Stage Area - localização temporária - depois são transformados para chegarem até o seu destino final e por fim são carregados) ----> METADADOS E REPLICAÇÃO ---> DATA MARTS ( middlewares: intermediações entre o DM e outras aplicações).
Complementando:
Enterprise Data Warehouse (EDW): contém todas as informações de negócio de uma organização de forma acessível para toda empresa.
Operational Data Store (ODS): repositório intermediário de dados utilizado para relatórios operacionais e como uma fonte de dados para o Enterprise Data Warehouse (EDW).
(CESPE / CEBRASPE - 2013 )Em ETL, frequentemente, é necessário limpar, ajustar e consolidar os dados antes de realizar sua carga. Nesse estágio de transformação, aplicam-se regras ou funções aos dados extraídos para ajustar os dados a serem carregados. A limpeza trata de vários tipos de erros, como, por exemplo, valores ilegais, ou que não obedeçam às regras de integridade da base, e erros de ortografia. CERTO
(FCC/2018/PREFEITURA)Para extrair dados de fontes de dados heterogêneas que irão alimentar um Data Warehouse de forma homogênea e concisa, servindo de base para gerar relatórios e gráficos para apoiar as decisões da gerência da organização, deve-se utilizar um processo conhecido como = ETL ( CERTO)
(CESPE/ME/2020)O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.(CERTO)
-
ETL - EXTRACT, TRANSFORM AND LOAD
Técnica de extração de diversas fontes - homogêneos e/ou heterogêneos. Realiza o pré-processamento dos dados, os limpa e padroniza (fase da transformação) e manda (fase do carregamento) para DW.
No DW, os dados, por meio de alguns processos (OLAP e Data Minning, por exemplo), poderão ser usados para tomadas de decisões.