SóProvas


ID
191818
Banca
CESGRANRIO
Órgão
ELETROBRAS
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Um data mart do departamento de vendas de uma grande empresa possui uma tabela fato com cinco métricas associadas a oito diferentes dimensões. O analista de TI está em dúvida sobre que modelagem utilizar. Considerando-se as opções snowflake e star schema, qual a desvantagem de se utilizar, nessa situação, a modelagem snowflake?

Alternativas
Comentários
  • Segue link com material muito interessante para quem se interessar

    http://projetos.inf.ufsc.br/arquivos_projetos/projeto_823/080702%20-%20TCC%20Miguel%20Nuno.pdf

    Bons estudos.
    •  b) Uma maior quantidade de joins entre as tabelas de dimensões e as tabelas de hierarquia associadas será realizada, ocasionando queda de desempenho no processo de agregação das métricas.
    Devido a Normalização ( Eliminação de redundâncias que causa diminuição no armazenamento dos dados do DW)  as consultas terão que combinar essas tabelas , de fatos e de hierarquia de dimensões, para construir o cubo de dados, de forma que essas junções vão inevitavelmente diminuir o desemprenho do DW.
     
  • É questionado qual desvantagem de usar a modelagem snowflake.  Uma delas seria: 
    "
    O Modelo Floco de Neve (Snow Flake) reduz o espaço de armazenamento dos dados dimensionais mas acrescenta várias tabelas ao modelo, deixando-o mais complexo e tornando mais difícil a navegação pelos softwares que utilizam o banco de dados.
    Um outro fator é que é necessário utilizar mais tabelas para executar uma consulta, então mais JOINS de instrução SQL são feitos, tornando o acesso aos dados mais lento do que no modelo estrela.

    "
  • a) A modelagem star schema não contempla a possibilidade de armazenamento de atributos para cada dimensão, minimizando a quantidade de memória utilizada.
    Errado. O modelo starschema eh o q mais consome espaço, pois é não normalizado(e ha muita informação redundante). O outro erro da questao eh q em cada dimensao ha atributos. Alias, essa afirmativa nem faz sentido, pois sabemos q cada dimensao se relaciona com um fato e isso so ja exige um atributo - o atributo chave.
    b)Uma maior quantidade de joins entre as tabelas de dimensões e as tabelas de hierarquia associadas será realizada, ocasionando queda de desempenho no processo de agregação das métricas.
    Correta. [1] afirma q o modelo starschema tem grande ganho de desempenho em relação ao snowflake, pois mesma q haja redundancia, ela fica compensada pelas reduções dos comandos joins, comando esse necessario no modelo snowflake, pelo fato de este estar normalizado - dividido em varias tabelas hierarquicamente relacionadas.
    c)As chaves estrangeiras, relativas às dimensões armazenadas na tabela fato, devem corresponder às hierarquias existentes nessas dimensões, ocasionando maior quantidade de registros na tabela fato.
    Errada. Na verdade, deve apontar para o nivel mais baixo da hierarquia. Imagine a dimensão tempo, com "dia, mes e ano". No starschema esta hierarquia estará em uma única tabela de dimensão, e fica como se a tabela de fatos estivesse ligada ao nível mais baixo da hierarquia, "dia".
    Já no snow flake, a hierarquia será representada por diferentes tabelas, mas a tabela "fatos" estará também ligada ao nível mais baixo, ou seja, "dia"(fatos terá como chave estrangeira a chave primária da tabela dia; dia terá como chave estrangeira a chave primária da tabela mês, e esta terá com chave estrangeira a chave primária da tabela de ano.
    d)Na modelagem snowflake, a manutenção dos dados dimensionais se torna mais dispendiosa, tendo em vista que as tabelas dimensionais não estão normalizadas.
    Pegue essa afirmativa e inverta-a totalmente e ela ficará correta. Nesse tipo de modelagem, a manutenção é mais barata, pois, segundo[1], o modelo snowflake eh o resultado da aplicacao da 3FN sobre as entidades dimensao, preservando a utilização dos  meios de armazenamento(como ele eh normalizado, evita a redundancia de valores textuais em uma tabela).
    e)Diferentemente da modelagem star schema, na modelagem snowflake, as chaves estrangeiras na tabela fato não apontam para o nível mais baixo (atômico) da hierarquia das dimensões associadas

    Errada. Como explicado na alternativa "C", o starschema não esta normalizado, ficando toda a hierarquia numa so tabela, resultando na "ligação direta" entre a tabela fatos e a dimensao da hierarquia mais baixa.

    Fontes:
    [1] Bi2: Business Intelligence, Palestino, carlos, Ed. Elsevier.

  • Resumo dos esquemas para estudar

    O Modelo Floco de Neve (Snow Flake) reduz o espaço de armazenamento dos dados dimensionais mas acrescenta várias tabelas ao modelo, deixando-o mais complexo e tornando mais difícil a navegação pelos softwares que utilizam o banco de dados. Um outro fator é que é necessário utilizar mais tabelas para executar uma consulta, então mais JOINS de instrução SQL são feitos, tornando o acesso aos dados mais lento do que no modelo estrela.

     

    O Modelo em Estrela (Star Schema) é mais simples e mais fácil de navegação pelos softwares, porém desperdiça espaço devido à repetição das mesmas descrições ao longo de toda a tabela. Análises feitas mostram que o ganho de espaço normalizando este esquema resulta em um ganho menor que 1% do espaço total no banco de dados, e como os custos do espaço em banco de dados são reduzidos quando comparados com outros este problema não é considerado crítico ou muito relevante pelos arquitetos dos Data Warehouses. Assim sendo existem outros factores mais importantes para serem avaliados para redução do espaço em disco como a adição de agregados e alteração na granularidade dos dados, que o esquema em estrela consegue responder com muito sucesso.