-
A granularidade diz respeito ao nível de detalhe ou de resumo contido nas unidades de dados existentes no data warehouse [INMON, 1997]. Quanto mais detalhe, mais baixo o nível de granularidade. Quanto menos detalhe, mais alto o nível de granularidade.
No ambiente de data warehouse, os dados são inicialmente extraídos de sistemas operacionais e de fontes externas, posteriormente integrados e transformados (limpos, eliminados, combinados, validados, consolidados, agregados e sumarizados), antes de serem carregados no data warehouse. Finalmente, os usuários acessam o DW através de ferramentas de front-end ou aplicações submetendo suas consultas, de modo a obterem informações que permitam a tomada de decisões. Um DW contém dados sumarizados, históricos e detalhados para suportar a tomada de decisões táticas e estratégicas.
A extração é o primeiro passo na obtenção de dados para o ambiente do DW. Significa basicamente ler e entender as fontes de dados e copiar as partes necessárias para a área de transformação de dados, a fim de serem trabalhadas posteriormente. Na grande maioria dos DW, os dados provêm de várias fontes diferentes e independentes, podendo ser essas fontes as bases de dados dos sistemas transacionais, planilhas excel, etc.
-
A questão abordou os conceitos de dados operacionais e dados informacionais.
Como a questão pediu as características do Business Intellegence (BI), devemos observar as características dos dados informacionais conforme página 108 do livro do Barbieri - Business Intellegence - Modelagem e Qualidade.
A) Conteúdo com valores correntes (DADOS OPERACIONAIS), e natureza dos dados estática (DADOS INFORMACIONAIS).
B) Dados organizados por assuntos/negócio (DADOS INFORMACIONAIS), e uso altamente estruturado em tabelas e processamento repetitivo (DADOS OPERACIONAIS).
C) Natureza dos dados dinâmica (DADOS OPERACIONAIS), e dados organizados por aplicação/sistema de informação (DADOS OPERACIONAIS).
D) Formato das estruturas dimensional (DADOS INFORMACIONAIS), e tempo de resposta otimizado para faixas abaixo de 1 segundo (DADOS OPERACIONAIS).
E) Acesso granular ou agregado, normalmente sem update direto (DADOS INFORMACIONAIS), e conteúdo com valores sumarizados, calculados, integrados de várias fontes (DADOS INFORMACIONAIS).
-
Business Intellegence (BI)
- Valores sumarizamos, calculados, integrados de várias fontes
- Por assunto
- Estática, até o refreshment dos dados de tempos em tempos
- Dimensional
- Acesso granular ou agregado, normalmente sem update direto
- Estrutura em fatos e dimensões, com processamento analítico/preditivo
- Análises mais complexos, com tempos de respostas maiores