-
A área de data staging é a área de trabalho do data warehouse. É o lugar onde se colocam os dados primários, onde se limpa, combina, arquiva e, ao final, exportam esses dados para um ou mais data marts. O propósito da área de data staging é preparar os dados para carregá-los em um servidor de apresentação (um SGBD relacional ou software OLAP).
-
Extrair, transformar e carregar dados são funções das ferramentas ETL, não do Data Staging Area. O DSA é apenas um local de armazenamento temporário.
http://data-warehouses.net/architecture/staging.html
-
Essa questão é recorrente, veja como a CESPE já cobrou essa questão anteriormente:
Petrobras 2007
Durante o ciclo de vida de uma datawarehouse, as operações de extração, transformação e carga, coletivamente chamadas de STAGING, são realizadas antes das operações de sumarização, categorização e indexação
gabarito: certo
-
Para mim essa questão deveria ser errada e não certa. "data staging area" é uma área de trabalho temporário, que é usada pelas ferramentas de ETL.
-
Concordo. o data staging area é tão somente uma área de trabalho.
-
A função do Staging area não é "extrair, transformar e carregar os dados obtidos", mas sim o local onde isso ocorre. Se tivesse escrito "onde se extraim transforma..." ficaria mais adequado.
Nós temos que ser maliciosos na interpretação, nessas questões devemos levar em conta a essência...
Faz parte da prova.
-
Não vejo como considerar essa afirmativa correta:
data staging area - é o local onde os dados extraídos dos bancos transacionais são colocados temporariamente para serem tratados e então enviados para o DW ou DM.
Ferramenta ETL/ETC - é a ferramenta que faz a extração dos dados no banco transacional para uma data staging area, transforma (limpa e trata) esses dados e, finalmente, carrega os dados no DW.
Eu entraria com recursos certamente.
-
ETL, do inglês Extract Transform Load (Extração Transformação Carga), são ferramentas de software cuja função é a extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e por fim a carga dos dados em um Data Mart ou um Data Warehouse. A extração e carga são obrigatórias para o processo, sendo a transformação/limpeza opcional. É considerada uma das fases mais críticas do Data Warehouse e/ou Data Mart.
No armazém de dados termos, uma área de preparação de dados é uma área de armazenamento intermediário entre as fontes de informação e data warehouse (DW) ou Data Mart (DM). É normalmente de natureza temporária, e seu conteúdo pode ser apagado após o DW / DM foi carregado com sucesso.
A área de teste pode ser utilizado para qualquer uma das seguintes finalidades, entre outros:
- Para reunir dados de diferentes fontes que estarão prontos para processar em momentos diferentes.
- Para carregar rapidamente informações a partir do banco de dados de funcionamento, libertando-se o mais rapidamente possível. Todas as transformações necessárias podem então ocorrer, sem interferir com a operação.
- Para encontrar mudanças contra atuais valores DW / DM.
- Para ' limpeza de dados '
- Para pré-calcular agregados.
- Uma vez que a estrutura de dados de teste não necessita de se assemelhar a estrutura de origem ou o destino, [ 1 ] o processo simples de carregar a área de teste pode ser um passo de ETL processo em si mesmo.
Questão esta errada!!!!
-
A banca diz que uma coisa errada é certa e ela se torna certa mesmo contrariando a literatura existente... Pouca seriedade na condução desses concursos!
-
A questão
"Importante componente de um data warehouse é o data staging area, cuja função é extrair, transformar e carregar os dados obtidos de diversas fontes da empresa."
é totalmente compatível com o que diz Carlos Barbieri, no livro "BI2 - Business Intelligence", 2011:
"As funções de ETC (extração, transformação e carga), responsável pelas ações de coleta, limpeza, preparação e carga desses depósitos de informações, estão representadas pela camada de Staging."
Segundo alguns autores, incluindo o Barbieri, a área de staging é responsável tanto pelo processo de ETL, quanto pelo armazenamento temporário ODS. Isso pode ficar confuso, pois outros autores consideram ODS como a mesma coisa que Staging Area, e ETL seria algo separado.
-
Segundo Ralph Kimball - The Data Warehouse Toolkit
Data Staging Area
The data staging area of the data warehouse is both a storage area and a set of processes commonly referred to as extract-transformation-load (ETL). The data staging area is everything between the operational source systems and the data presentation area.
-
Comentários do prof. Thiago Rodrigues Cavalcanti do ITnerante:
Componentes de um Data Warehouse usando a abordagem adotada por um dos seus principais autores Ralph Kimball:
Sistemas operacionais de origem: são considerados externos ao DW porque não existe pouco ou nenhum controle sobre o conteúdo e o formato dos dados. As principais propriedades desse sistema são o desempenho e a disponibilidade de processamento.
Data Staging Area (DSA): é tanto uma área de armazenamento quanto um conjunto de processos e normalmente denomina-se ETL (Extract – Transformation – Load). O principal requisito de arquitetura da DAS é não está acessível aos usuários e que não forneça serviços de consulta nem de apresentação. Aqui é definido o processo de obtenção dos dados e que seque os seguintes passos: Extração para o Staging Area, Transformações (Filtragem dos dados, Combinação dos dados, Cancelamento de dados duplicados) e Carga.
Apresentação dos dados: é o local onde os dados ficam organizados, armazenados e tornam-se disponíveis para serem consultados diretamente pelos usuários, por criadores de relatórios e por outras aplicações de análise. Kimball se refere à área de apresentação como uma série de data marts integrados. Um Data Mart é uma parte do todo que compões a área de apresentação. Ainda na visão do Kimball, os dados na área de apresentação que podem ser consultada no DW precisam ser dimensionais, atômicos e obedecerem à arquitetura de barramentos do data warehouse.
Ferramentas de acesso a dados: o último componente principal do ambiente de DW. O termo ferramenta refere-se à variedade de recursos com que usuários de negócio podem contar para melhorar a tomada de decisões analítica.
-
Data Staging Area (Kimball)
É tanto uma área de armazenamento (dados voláteis) como um conjunto de processos, e normalmente denomina-se ETL (Extract – Transformation - Load)
Questão Certa