SóProvas


ID
2646208
Banca
CESPE / CEBRASPE
Órgão
TCM-BA
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de modelagem dimensional, assinale a opção correta.

Alternativas
Comentários
  • Bizu

    A)Existem 6 tipos de Fatos
    Fato transacional->Mais comuns, usam métricas aditivas que pode se somar por todas dimensões;
    Fato agregada-> Função acelerar o desempenho das consultas, consolidam Coisas;
    Fato consolidada->Diferente da tabela agregada server para consolidar duas fatos(no processo ETL as duas fatos são carregadas e misturadas);
    Fato snapshot periódico->Baseada no tempo, seja data,dia , semana ou hora(pega um momento períodico, tira uma fotografia e insere no fato);
    Fato de snapshot acumulado - >também é uma fotografia entretanto em mais de um momento;
    Fato sem fato(factless fact table)-> Fato sem métricas, serve para fazer intersecção de dimensões, cruzamento para comparações, pode inserir fatos fakes sem conteúdo apenas para cruzamento entre dimensões.

     

    B)Dimensão e Fato são obrigatórias e se complementam- São Tabelas !
    Tabela Fato armazena as métricas e ass chaves estrangeiras

     

    C)Mode Estrela (Star Schema) -> As Dimensões não são normalizadas !

     

    D)Modelo floco de neve(SnowFlake) -> Diferente do modelo start Schema a tabela é NORMALIZADA tendo um desempenho pior pois aumenta o número de tabelas com a normalizaçã, consequencia seria aumentatr o espaço de armazenamento mas fiquei em dúvida nessa alternativa.

     

    E) não compreendi.

  • Não vejo erro na alternativa D.

  • d) O modelo floco de neve (SnowFlake) aumenta o espaço de armazenamento dos dados dimensionais, pois acrescenta várias tabelas ao modelo, todavia torna mais simples a navegação por software que utilizarão o banco de dados.

    Não torna nada de mais simples justamente pelo fato das tabelas dimensões serem normalizadas nesse modelo, então quanto mais tabelas mais dificil a navegação e menos desempenho.

     e) Os códigos e as descrições associadas, usadas como nomes de colunas em relatórios e como filtros em consultas, não devem ser gravados em tabelas dimensionais.

    Aqui ta dizendo que os valores dos atributos descritivos não devem ser gravados em tabelas dimensionais, hora se essas descrições não forem gravas como iremos analisar um fato? Para isso existem as tabelas dimensões para gravar esses valores

  • É importante deixar claras as diferenças entre os modelos estrela e snowflake:

     

    1. Star Schema (Estrela): Mais popular, mais rápido, com uma tabela por dimensão. É menos flexível e desperdiça espaço, pois repete as mesmas descrições ao longo de toda a tabela. Possui uma tabela de fato e várias tabelas para cada dimensão, e propõe uma visão com a presença de dados redundantes nas tabelas de dimensão.

    · Normalização: Não normaliza as dimensões.

    · ​Espaço de armazenamento: Alto, pois por não haver normalização das tabelas, há muitos registros duplicados.

    · ​Integridade: Mais propensa a problemas de integridade dos dados, devido a duplicação, dificultando futuras modificações e manutenções.

    · ​Complexidade de query: Menos tabelas. Não há necessidade de relacionar muitas tabelas diferentes, logo a consulta é mais fácil.

    · ​Utilização: Data mart, pois o espaço de armazenamento exigido é pequeno e busca-se facilidade nas consultas de query.

     

    2. Snowflake Schema (Floco de Neve): Variação do modelo estrela. Ele reduz o espaço de armazenamento, mais flexível, porém mais lento. Apresenta o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros.

    · Normalização: Tabelas de dimensão são normalizadas.

    · ​Espaço de armazenamento: Reduzido, pois a normalização reduz a quantidade de registros redundantes.

    · ​Integridade: Maior facilidade para realizar futuras modificações e manutenções, pois há pouca redundância de dados.

    · ​Complexidade de query: Por haver mais tabelas as consultas são maiores e mais complexas.

    · ​Utilização: Data warehouse, pois dessa forma é possível economizar muito espaço de armazenamento.

  • Aos não assinantes,

    GABARITO: A

  • Entendi que a questão pedia quais eram as granularidades. granularidade e tipos de fatos sao as mesmas coisas ??
  • a) Isso mesmo. São as granularidades consideradas por Kimball que mostramos durante a nossa aula. Transacional armazena os registros individuais, tendo as transações como seu grão. Snapshot periódico armazena uma “fotografia”, que contém registros agregados ao fim de um determinado período de tempo. Snapshot acumulado é um tipo de granularidade que permite a atualização de registros, aplicável quando se tem a representação de um processo com etapas intermediárias bem definidas. CERTA

    b) O fato de serem componentes de um cubo não impede que os dados estejam armazenados em um banco de dados, seja ele relacional ou multidimensional. ERRADA

    c) Podemos deixar a alternativa correta somente trocando a palavra “normalizadas” por “desnormalizadas”. A desnormalização objetiva tornar mais ágeis as consultas analíticas. ERRADA

    d) O snowflake diminui o espaço necessário para o armazenamento dos dados em relação ao esquema estrela, já que a normalização realizada elimina dados redundantes. Além disso, a navegação no modelo normalizado se torna mais complexa, devido ao aumento do número de estruturas no modelo e por consequência do maior número de operações de junção entre tabelas que são necessárias para se extrair os dados. ERRADA

    e) Os códigos e descrições utilizados como filtros e geralmente como nomes de colunas em relatório são justamente os dados que são armazenados em dimensões. ERRADA

  • A) CORRETO As tabelas fatos podem ser estruturadas de três forma distintas que representam a forma como queremos armazenar as informações: transacional, snapshot periódico e snapshot acumulado. Essa classificação vai influenciar a escolha da granularidade da tabela fato.

    B) ERRADO Os fatos e dimensões são tabelas dos bancos de dados multidimensionais estruturados em uma base relacional.

    C) ERRADO No modelo estrela as dimensões não são normalizadas. A normalização aparece nos modelos floco de neve e tem por objetivo reduzir a redundância dos dados e não a melhora do desempenho das consultas.

    D) ERRADO Pela justificativa da alternativa anterior, podemos observar que o modelo floco de neve reduz o espeço de armazenamento quando reduz a redundância dos dados.

    E) ERRADO Cada dimensão deve conter os atributos descritivos sobre os dados armazenados na tabela fato.

    Fonte: https://www.estrategiaconcursos.com.br/blog/gabarito-extraoficial-tcm-ba-analise-de-informacoes-tem-recurso/

  • Existem três granularidades fundamentais para classificar todas as tabelas fato: transacional, snapshot periódico, ou snapshot acumulado. Cada um dos tipos básicos de tabelas fato estão em:

    ·        transacional: Uma linha na tabela fato transacional corresponde a uma medida de um ponto no espaço e tempo e o grão da transação dessa tabela fato é a mais dimensional e expressiva das tabelas fato;

    ·        snapshot periódico: Uma linha em uma tabela fato snapshot periódico sumariza muitas medidas ocorridas em um período padrão, tal como dia, semana ou mês, ou seja, o grão é o período, não a transação individual;

    ·        snapshot acumulado: Uma linha em uma tabela fato snapshot acumulado sumariza muitas medidas ocorridas entre o início e o fim de um fluxo de trabalho ou processo, ou seja, o grão são as etapas do fluxo.

    Modelo Estrela (Star): o esquema estrela é uma estrutura simples, com poucas tabelas e ligações bem definidas, assemelha-se ao modelo de negócio e facilita a leitura e entendimento por todos. O nome estrela está associado à disposição das tabelas de dimensão e de fatos do modelo.

    Tabela de fatos é a tabela dominante de um esquema de modelagem tipo estrela (Star Schema), criado pelo Dr. Ralph Kimball, em um modelo multidimensional, e tem como característica principal a presença de dados altamente redundantes (desperdício de espaço) para se obter um melhor desempenho. A tabela de fatos, no "centro" da estrela, fica rodeada por tabelas auxiliares, chamadas de tabelas de dimensão. 

    Modelo Floco de Neve (Snow Flake): é uma variação do esquema estrela, no qual todas as tabelas de dimensão são normalizadas na segunda forma normal (2FN), ou seja, são retirados das tabelas os campos que são funcionalmente dependentes de outros campos que não são chaves. O Snow Flake reduz o espaço de armazenamento, é mais flexível (facilita evolução das Tabelas Dimensão), mas é mais lento. Recomenda-se utilizar o esquema floco de neve apenas quando a linha de dimensão (número de atributos da tabela) ficar muito longa e começar a ser relevante do ponto de vista de espaço de armazenamento.

    Uma vez que os esquemas floco de neve possuem menor redundância do que os esquemas estrela, sua manutenção é mais fácil de ser realizada.

  • e) Os códigos e as descrições associadas, usadas como nomes de colunas em relatórios e como filtros em consultas, não devem ser gravados em tabelas dimensionais.

    ERRADA. Justamente por serem descrições dos atributos, os mesmos devem ser armazenados nas tabelas dimensionais.

  • Questões de multipla escolha são muito legais kkk eu não sabia se a letra "a" estava errada ou não, mas eu sabia que as outras estavam erradas kkkk

    • ESQUEMA ESTRELA
    • ALTA REDUNDÂNCIA - ALTA PERFORMANCE - ALTA OCUPAÇÃO DE ESPAÇO EM DISCO
    • ESQUEMA FLOCOS DE NEVE
    • BAIXA REDUNDÂNCIA - BAIXA PERFORMANCE - BAIXA OCUPAÇÃO DE ESPAÇO EM DISCO
    • Fato transacional->Mais comuns, usam métricas aditivas que pode se somar por todas dimensões;
    • Fato agregada-> Função acelerar o desempenho das consultas, consolidam Coisas;
    • Fato consolidada->Diferente da tabela agregada server para consolidar duas fatos(no processo ETL as duas fatos são carregadas e misturadas);
    • Fato snapshot periódico->Baseada no tempo, seja data,dia , semana ou hora(pega um momento períodico, tira uma fotografia e insere no fato);
    • Fato de snapshot acumulado - >também é uma fotografia entretanto em mais de um momento;
    • Fato sem fato(factless fact table)-> Fato sem métricas, serve para fazer intersecção de dimensões, cruzamento para comparações, pode inserir fatos fakes sem conteúdo apenas para cruzamento entre dimensões.