- ID
- 5401
- Banca
- CESGRANRIO
- Órgão
- Petrobras
- Ano
- 2006
- Provas
- Disciplina
- Banco de Dados
- Assuntos
Qual das opções abaixo apresenta somente serviços de middleware?
Qual das opções abaixo apresenta somente serviços de middleware?
Sobre o processo de modelagem multidimensional, assinale a afirmação INCORRETA.
Analise as seguintes afirmações relacionadas a modelagem de dados e a projeto de banco de dados multidimensional:
I. O modelo multidimensional representa os dados como uma matriz na qual cada dimensão é um tema ou assunto do negócio que será objeto da análise. É uma técnica particularmente útil para inspeção, sumarização e arranjo de dados para facilitar a sua análise.
II. O modelo entidade-relacionamento é o "coração" do modelo multidimensional.
III. Na modelagem multidimensional, os relacionamentos são conseqüência da existência de "fatos" como intersecção de diversas "dimensões". Por exemplo, se há vendas para o cliente 499, do produto 10455, então o relacionamento entre cliente e produto está estabelecido.
IV. Por ser um sistema de consulta, o modelo multidimensional representa os dados estáticos, de forma que o tempo é uma variável que nunca será considerada como uma de suas dimensões.
Indique a opção que contenha todas as afirmações verdadeiras.
Considerando os modelos multidimensionais de bancos de dados de sistemas de informações gerenciais e modelos relacionais utilizados em sistemas operacionais, é correto afirmar que:
Em um banco de dados multidimensional, os dados estão conceitualmente armazenados e organizados em
O agrupamento de diversas dimensões correspondentes a indicadores com baixa cardinalidade, gerando uma dimensão abstrata, de forma a retirar os indicadores da tabela fato, mas preservando a possibilidade de seu uso em consultas, constitui a
São modelos fortemente associados à estrutura de um banco de dados multidimensional:
Além das ferramentas para gerenciamento de banco de dados,
várias outras ferramentas de software atuam como front ends para
gerenciadores de bancos de dados, como geradores de relatórios,
geradores de consultas, geradores de formulários de entrada de
dados, ferramentas de modelagem e de dicionário de dados, de
engenharia reversa, de data warehousing, de benchmarking, de
auditoria, de recuperação de dados, entre outras. Considerando os
conceitos relacionados a essas ferramentas, julgue os itens
seguintes.
Ferramentas do tipo ROLAP apresentam maior nível de multidimensionalidade e latência mais elevada no acesso aos dados que as do tipo MOLAP.
Com relação aos conceitos de modelagem dimensional, assinale a opção correta.
Considere as proposições abaixo, a respeito de Bancos de Dados.
I - Uma das técnicas para armazenamento de dados dimensionais é a organização de tabelas, segundo o Esquema Estrela. Em bases de dados, que atendem a esse esquema, podem-se encontrar tabelas que não atendam à Terceira Forma Normal.
II - Bases de dados de apoio à tomada de decisão armazenam grande quantidade de dados. Por isso, não é recomendável a criação de índices em tais bases de dados.
III - Em gerenciadores de bancos de dados multidimensionais podem ser encontrados operadores que permitem percorrer hierarquias existentes. Dentre tais operadores estão o de Drill Down e o de Drill Up.
IV - O procedimento de Extração, Transformação e Carga (também conhecido por ETL) é um dos processos realizados em ambientes de depósitos de dados (data warehouse). Nesse contexto, a Extração se refere à tarefa de retirada de dados do data warehouse (visando a reduzir os dados antigos); a Transformação se refere ao processo de compactação de dados, e a Carga se refere à tarefa de inclusão de novos dados no data warehouse.
V - Uma das características de bases de dados de apoio à tomada de decisão é a necessidade de armazenarem dados que refletem sempre a situação atual do assunto que representam. Nesse tipo de base de dados, quaisquer informações que não sejam atuais podem ser descartadas, pois não auxiliam em uma boa tomada de decisão.
Estão corretas APENAS as afirmativas
Julgue os itens a seguir, a respeito de sistemas de suporte a
decisão.
Em um esquema multidimensional estrela, os dados dimensionais podem ser indexados para tuplas na tabela de fatos por meio da indexação de junções, que consiste em uma técnica em que é construído um vetor de bits para cada valor em uma coluna (domínio) que está sendo indexada. Essa técnica é indicada para domínios com baixa cardinalidade.
Em um banco de dados multidimensional, considere, por exemplo, que os dados podem ser representados como um array de três dimensões, correspondendo a produtos, clientes e períodos de tempo. Dessa forma, um determinado valor individual em uma célula pode representar a quantidade de um produto vendido a um cliente em um dado momento. De acordo com essa consideração,
No contexto das consultas a bancos de dados de esquema em estrela e supondo que os acessos a tabelas de dimensões e o acesso subsequente à tabela de fatos estejam todos incorporados em uma mesma consulta, é mais adequado o uso de junção em estrela que é uma estratégia específica de implementação de junção, a qual difere das demais estratégias pelo fato de começar deliberadamente pelo cálculo
Para atender a modelagem de bancos multidimensionais, a cláusula GROUP BY admite (padrão SQL:1999) as opções
Assinale a opção correta acerca dos modelos de dados.
Os data warehouses são sistemas computacionais que armazenam
os dados corporativos de forma consolidada, disponibilizando
informações com maior eficiência, consistência e segurança para a
tomada de decisão dos gestores. Acerca dos data warehouses,
julgue os itens que se seguem.
Por fazerem uso de um processo de modelagem dimensional, os data warehouses não podem ser instalados em sistemas de banco de dados relacionais.
Os data warehouses são sistemas computacionais que armazenam
os dados corporativos de forma consolidada, disponibilizando
informações com maior eficiência, consistência e segurança para a
tomada de decisão dos gestores. Acerca dos data warehouses,
julgue os itens que se seguem.
Os atributos da tabela de dimensões possibilitam os recursos de slicing e dicing analíticos.
Com o objetivo de analisar possíveis falhas no processo de venda de determinado produto, um Gerente de Vendas, ao consultar o banco multidimensional de seu departamento, identifica um valor abaixo da média no mês de maio de 2010, na região Sudeste, relativo ao produto. Sabendo que a dimensão "Região" está construída de forma a mostrar os dados desde o nível nacional até o nível município, para encontrar a cidade que seja o foco da queda de vendas nessa região, o Gerente de Vendas deverá efetuar sobre a dimensão Região a operação de
Numa grande multinacional, os dados relativos aos sistemas transacionais são lidos, transformados e carregados para posterior apresentação sob a forma dimensional. O departamento de TI reservou uma área de armazenamento específica às informações lidas e transformadas, denominada staging area. A respeito dessa área de dados, afirma-se que
A mudança de uma hierarquia (orientação) dimensional para outra tem sua realização facilitada em um cubo de dados por meio de uma técnica chamada
Quando, em um modelo multimensional, o usuário pular um nível intermediário dentro de uma mesma dimensão, como por exemplo, sendo a dimensão tempo composta por ano, semestre, trimestre, mês e dia e o usuário pular de ano para mês, a operação executada corresponde a
Quando, em um modelo multimensional, o usuário pular de uma informação contida em uma dimensão para outra como por exemplo, da dimensão tempo para a dimensão região, a operação executada corresponde a
No modelo multidimensional, significa, de forma simplificada, a redução do escopo dos dados em análise, além de mudar a ordem da dimensões, mudando, desta forma, a orientação segundo a qual os dados são visualizados.
Trata-se de
Utilizando uma base multidimensional, o usuário passou da análise de informações sob a ótica da dimensão tempo para a visão sob a dimensão regional. A operação OLAP aí realizada foi
A respeito de administração de dados, modelagem de banco de
dados relacionais e normalização, julgue os itens que se seguem.
O modelo multidimensional contém elementos básicos como a tabela fato, as dimensões, as métricas e as medidas. As dimensões participam de um fato, determinando o contexto do modelo, enquanto a tabela fato reflete a evolução dos negócios por meio das métricas aditivas ou não aditivas. Se a modelagem for do tipo snowflake, as medidas ficarão inseridas tanto nas dimensões quanto na fato, por haver um grau de normalização maior que no esquema star-schema.
No que se refere ao papel da informação nas organizações, assinale a opção correta.
Assinale a opção correta com referência à modelagem dimensional.
Assinale a opção correta, a respeito de modelagem dimensional.
Sobre modelagem multidimensional, o cubo:
I. é uma representação intuitiva, pois todas as dimensões coexistem para todo ponto no cubo e são independentes umas das outras;
II. é, de fato, apenas umametáfora visual;
III . serve para descrever requisitos funcionais.
Acerca dos itens acima mencionados, apenas;
A respeito de modelagem dimensional, julgue os itens
subsequentes.
A ferramenta OLAP (on-line analytical processing) permite realizar as operações slice, dice e pivot sobre uma estrutura multidimensional. A operação slice fixa o valor de uma dimensão e recupera os valores das demais dimensões; a operação dice intercambia dimensões permitindo diferentes visualizações dos dados; e a operação pivot fixa o valor de duas ou mais dimensões e recupera os valores das demais.
Uma das características do modelo estrela é a representação explícita das hierarquias de atributos, com economia de armazenamento de espaço.
PORQUE
O frequente uso do modelo multidimensional de dados estrela justifica-se pela sua simplicidade e pela preocupação com a normalização das suas dimensões.
Analisando-se as afirmações acima, conclui-se que
Com relação aos sistemas gerenciadores de banco de dados “multidimensionais”, os dados são armazenados em tabelas de “fatos” e tabelas de “dimensões” que se relacionam em um esquema denominado:
O modelo estrela, como estrutura básica de um modelo de dados multidimensional, possui uma configuração típica composta de uma entidade central
O modelo dimensional, implementado em sistemas de data warehouse, tornou-se uma importante ferramenta de análise de negócios.
Nesse modelo,
A abordagem multidimensional, também chamada de modelo estrela no Brasil, tem esse nome porque sua representação considera uma tabela central, conhecida como tabela fato, e tabelas ao seu redor, conhecidas como tabelas dimensão.
Uma das importantes características da abordagem multidimensional é
Acerca de modelagem multidimensional de dados, julgue o item que se segue.
Em bases de dados multidimensionais, entre as ferramentas e métodos que podem ser utilizados para se aumentar a eficiência das consultas se incluem as funções especiais OLAP (online analytical processing) relacional (ROLAP) e multidimensional (MOLAP), as extensões SQL e os métodos de junção (join) sofisticados.
Acerca de conceitos básicos, arquiteturas e aplicações de data
warehouse e datamining e técnicas de modelagem e otimização de
bases de dados multidimensionais, julgue os itens que se seguem.
Um cubo de dados é a representação multidimensional dos dados não agregados na qual é necessário que as dimensões tenham o mesmo tamanho.
Com relação a modelagem de dados e OLAP, julgue os próximos
itens.
A atualização (refreshing) e a eliminação (purging) de dados são processos essenciais para a otimização do armazenamento dos dados em um banco de dados multidimensional.
Em bases de dados multidimensionais, os dados são organizados em cubos de dados. A esse respeito, considere as afirmações a seguir.
I - Os usuários podem consultar os dados segundo qualquer uma das dimensões do cubo de dados.
II - O pivoteamento (ou rotação) é utilizado em cubos de dados para mudar a hierarquia dimensional que está sendo correntemente utilizada por outra.
III - A operação de drill-down refere-se a um movimento no sentido descendente da hierarquia de uma dimensão, desagregando os dados e os apresentando em uma visão mais detalhada.
É correto o que se afirma em
Julgue os próximos itens, a respeito de conceitos e aplicações de técnicas de modelagem dimensional e otimização de bases de dados.
Em um banco de dados geográfico, a referência de um objeto geométrico pode ser armazenada na forma vetorial, como um ponto com coordenadas x e y.
Julgue os próximos itens, a respeito de conceitos e aplicações de técnicas de modelagem dimensional e otimização de bases de dados.
Na modelagem multidimensional, a tabela de fatos deve ser normalizada até a terceira forma normal (3FN), a fim de otimizar o armazenamento e permitir que as consultas sejam respondidas rapidamente.
Os modelos multidimensionais tiram proveito dos relacionamentos inerentes aos dados para preencher os dados em matrizes multidimensionais, chamadas cubos de dados. Em relação a este tipo de modelagem, assinale a alternativa correta.
Julgue os itens subsequentes, a respeito de sistemas de suporte a` decisão.
Em uma modelagem multidimensional, cada dimensão deve possuir uma chave de acesso associada ao ambiente transacional no momento do ETL. Nesse tipo de modelagem, a utilização de chaves semânticas ou naturais, em vez de chaves artificiais ou surrogate keys, agrega, entre outras vantagens, maior integração entre o ambiente operacional e o transacional, o que facilita operações de drill down em arquiteturas do tipo ROLAP; maior estabilidade no projeto; melhor nível de consistência nos dados e mais facilidade de conferência na importação dos dados no ETL.
Com relação a sistemas de suporte à decisão, julgue os seguintes itens.
Na modelagem multidimensional, é possível haver mais de uma tabela fato no mesmo modelo. A tabela fato expressa a relação N:M (muitos-para-muitos) entre as dimensões, que, por sua vez, implementam a visão e a interface do usuário ao DataWarehouse.
Com relação a sistemas de suporte à decisão, julgue os seguintes itens.
Na modelagem multidimensional, há dois esquemas predominantes: Star, em que as dimensões são tipicamente normalizadas até a 3.ª forma normal (3FN); e SnowFlake, no qual as dimensões são desnormalizadas.
Um sistema OLAP é um sistema interativo que permite que um analista veja diferentes resumos de dados multidimensionais. Sobre estes sistemas, considere:
I. A generalização de uma tabulação cruzada bidimensional para n dimensões pode ser visualizada como um cubo n-dimensional, chamado cubo de dados.
II. Pode-se obter uma tabulação cruzada sobre os atributos x e y, para um valor variável de z em uma relação R. Esta operação é chamada de slicing (corte em pequenos cubos) ou dicing (corte em fatias), particularmente quando os valores para várias dimensões não são fixos.
III. A operação de mudar as dimensões usadas em uma tabulação cruzada é chamada de pivoting (pivoteamento).
IV. A operação de passar de dados com detalhamento maior para um detalhamento menor é chamada de drill down. A operação contrária é chamada de rollup.
Está correto o que consta APENAS em
Acerca dos sistemas de suporte à decisão e inteligência de negócio, julgue os itens subsequentes.
Organizar os atributos em uma hierarquia, em que o nível mais elevado apresenta as agregações mais esparsas e os níveis inferiores apresentam maiores detalhes, constitui uma técnica para modelagem de dados multidimensional.
Acerca de sistemas de suporte à decisão, técnicas de modelagem e otimização de bases de dados multidimensionais, assinale a opção correta.
a) ERRADA Na modelagem multidimensional, caso haja as dimensões tempo e local ligadas a fato, é necessário optar-se por uma delas, pois somente uma dimensão poderá estar presente em cada modelo.
Uma tabela fato tem que ter, no mínimo, 2 tabelas dimensão.
b) ERRADA É possível haver somente uma tabela fato na modelagem multidimensional, e um fato poderá guardar no máximo uma medida, pois cada medida é uma representação unívoca de um fato.
Tabela fato pode guardar mais de uma medida (atributo quantificável).
c) ERRADA As dimensões na modelagem da base de dados podem ser do tipo aditivas e não aditivas, sendo ambas oriundas da modelagem Snow Flake.
Pode ser também derivadas e semi-adtivas. Pode ser oriundas do Star Schema também.
d) ERRADA Para prover maior desempenho nas consultas aos data warehouses, os dados devem ser desnormalizados, devendo ser mantido o mesmo valor das chaves primárias entre a fonte de dados e as chaves das dimensões.
Isso não é uma condição absoluta. Isso vai depender do momento e da forma com será tratada os dados.
e) CORRETA Em sistemas transacionais, em que as transações são a unidade e o agente de mudança no banco de dados, as informações no data warehouse são não voláteis e têm granularidade muito mais espessa, sendo atualizadas de acordo com uma escolha cuidadosa da política de atualização.
LETRA E
Só dando uma leve corrigida na letra D do MARCELO VINICIUS:
-A questão não apresenta a desnormalização como uma condição absoluta, porém, quando se tratando de modelagem Multidemensional, a desnormalização de dados PROVEEM MAIOR DESEMPENHO, vide a comparação entre StarSchem e SnowFlake.
O Erro da Alternativa é: devendo ser mantido o mesmo valor das chaves primárias entre a fonte de dados e as chaves das dimensões.
Os valores das chaves primarias nas fontes podem ser diferentes dos valores nas dimensões.
De resto o comentário tá topzera
DW são sistemas transacionais???
a) Essa afirmação não faz o menor sentido. É bastante frequente que se tenha as dimensões tempo e local ligadas às mesmas tabelas fato. ERRADA
b) É possível que haja somente uma tabela fato no modelo, sem problemas. O que está errado é dizer que um fato só pode guardar uma medida. Nessa alternativa, creio que “um fato” foi usado para se referir a um registro na tabela fato. Um registro nessa tabela, como você sabe, pode conter diversas medidas. ERRADA
c) As medidas podem ser aditivas ou não aditivas, e não as dimensões. Isso também não tem nada a ver com o conceito de snowflake. A alternativa é uma mistura sem sentido de diversos conceitos. ERRADA
d) A desnormalização realmente melhora o desempenho nas consultas em detrimento do espaço em disco e da redundância. Contudo, a reutilização de chaves primárias das fontes dos dados não faz muito sentido, já que estamos integrando dados de diversas fontes, o que poderia ocasionar duplicações nos valores das chaves primárias. Kimball, então, recomenda a utilização de chaves substitutas. ERRADA
e) A redação dessa alternativa ficou um pouco truncada, já que começa falando de sistemas transacionais e de repente passa pra data warehouse. Contudo, podemos perceber que o conceito apresentado está correto.
As informações no DW têm granularidade mais espessa que os sistemas transacionais, já que armazenam todo o histórico de um registro ao invés de simplesmente atualizá-lo ou removê-lo.
As tabelas também são atualizadas seguindo uma política criteriosa de atualização, com rotinas de carga de dados e granularidades diversas. CERTA
Sobre a letra D
"O primeiro trecho está correto. Realmente por motivos de desempenho consulta em data warehouses utilizam dados desnormalizados, porém não é necessário que se mantenha as chaves primárias das fontes, pois podem existir chaves candidatas que possam auxiliar no desempenho dessas consultas. Portanto alternativa errada."
(Pedro Parreira, TEC Concursos)
Link: https://www.tecconcursos.com.br/questoes/187389
tá meio zoada essa redação, mas as outras opções eram absurdas
O modelo de dados denominado “multidimensional” se aplica para banco de dados com a tecnologia:
Que tipo de aplicação OLAP combina a tecnologia de banco de dados relacionais com a de banco de dados multidimensionais?
Os sistemas HOLAP (Hybrid Online Analytical Processing) como o acrónimo indica, são uma mistura dos dois sistemas anteriores, tentando explorar as vantagens de ambos e colmatar as fraquezas de cada um.
Os sistemas ROLAP são capazes de aceder aos dados numa dada base de dados relacional e gerar as queries (consultas) necessárias no momento em que o utilizador as solicita.
MOLAP armazena os dados de detalhe (fatos) e as agregações em um modelo multidimensional. Não faz uso da base de dados relacional para acessar os dados dos cubos. Necessita de um processamento constante do cubo, embora apresente melhor desempenho. (FCC/2014)
Dentre os mecanismos de armazenamento de dados em OLAP, pode-se adotar uma abordagem híbrida, que combina o armazenamento de dados detalhados em um modelo relacional, com agregações pré-calculadas no formato multidimensional. Esse é o HOLAP, ou hybrid OLAP.
Uma das formas de modelagem utilizada no desenvolvimento de data warehouses é a modelagem multidimensional. Nesse tipo de modelagem,
As tabelas de Fatos contêm as métricas. Possui o
caráter quantitativo das informações descritivas armazenadas nas
Dimensões. É onde estão armazenadas as ocorrências do negócio e possui
relacionamento de “muitos para um” com as tabelas periféricas
(Dimensão).
Matéria completa:
http://corporate.canaltech.com.br/materia/business-intelligence/entendendo-a-modelagem-multidimensional-19988/
Gabarito: LETRA C
a) Existe UMA tabela fato e VÁRIAS tabelas dimensões (mínimo de 2 por tabela fato)
b) Existem sim chaves primárias para as tabelas fato e dimensão. Vale ressaltar que a chave primária da tabela fato é uma chave primária composta.
c) Correto.
d) Relacionamento 1:N (um para muitos)
e) As tabelas dimensões admitem tanto atributos literais, como atributos numéricos.
Quando o modelo de dados multidimensionais começa a ser definido, elementos básicos de representação precisam ter sido estabelecidos, de modo a se criar um padrão de modelagem. Considere um modelo em que as dimensões e fatos são representados em tabelas, podendo haver múltiplas dimensões e múltiplas tabelas de fatos.
Ao modelar cada tabela ...I... devem ser considerados os seguintes pontos:
- A chave primária é composta, sendo um elemento da chave para cada dimensão;
- Cada elemento chave para a dimensão deve ser representado e descrito na tabela ...II... correspondente (para efetuar a junção);
- A dimensão tempo é sempre representada como parte da chave primária.
Deve haver uma tabela ...III... para cada dimensão do modelo, contendo
- Uma chave artificial (ou gerada) genérica;
- Uma coluna de descrição genérica para a dimensão;
- Colunas que permitam ...IV... ;
- Um indicador nível que indica o nível da hierarquia a que se refere a linha da tabela.
As lacunas de a são corretas, e respectivamente, preenchidas com:
Da para sacar que o item I é tabela de fatos quando ele começa dizendo que "A chave primária é composta..."
LETRA C
Questão tirada ao pé da letra do site MSDN.
https://msdn.microsoft.com/pt-br/library/cc518031.aspx#XSLTsection126121120120
I. Para saber qual é a tabela de que esta lacuna trata, precisamos analisar suas características. A primeira delas é que sua chave primária é composta, havendo um elemento (chave estrangeira) para cada dimensão. Podemos ignorar, por ora, a segunda característica, já que esta contém uma lacuna. Por fim, na terceira característica, temos que sempre há um elemento temporal na chave primária da tabela.
Essas características estão comumente associadas às tabelas fato, já que estas possuem chaves compostas pelas chaves estrangeiras que apontam para as dimensões. Se considerarmos que a dimensão tempo sempre está presente nos modelos, a chave primária da tabela de fatos sempre irá conter uma chave estrangeira para a chave da dimensão tempo.
II. Como decorrência do que explicamos no item I, cada chave estrangeira da tabela de fatos deve fazer referência a uma dimensão, para que as junções possam ser realizadas.
III. Bem, essa não é muito difícil. Para cada dimensão do modelo há uma tabela de dimensão! Isso é corroborado pelas características que são descritas em seguida, como o fato de possuir uma chave substituta.
IV. Essa lacuna não pode ser avaliada de forma isolada, já que nela se encaixa qualquer característica das colunas das dimensões. Assim, nos utilizando das demais respostas, vemos que a resposta é efetuar os filtros, o que está correto, pois as características descritivas presentes nas dimensões são atributos que permitem a filtragem dos eventos da fato. Por exemplo, nas análises podemos filtrar os eventos da fato por ano, cidade, filial, etc.
Gabarito: C
A modelagem multidimensional é utilizada especialmente para sumarizar e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados. Um modelo multidimensional é formado por dimensões, e por uma coleção de itens de dados composta de dados de medidas e de contexto, denominada
O Star schema ou esquema em estrela é uma metodologia de modelagem de dados utilizada do desenho de um Data warehouse.
Os dados são modelados em tabelas dimensionais ligadas a uma tabela de fatos. As tabelas dimensionais contêm as características de um evento. A tabela de fatos armazena os fatos ocorridos e as chave para as características correspondentes, nas tabelas dimensionais.
O nome foi adotado devido a semelhança do modelo como uma estrela. No "centro" da estrela, existe a o que chamou tabela de fatos, rodeada por tabelas auxiliares, chamadas de dimensões. A tabela de fato conecta-se as demais dimensões por múltiplas junções e as tabelas de dimensões conectam-se com apenas uma junção a tabela de fatos.
Fonte: https://pt.wikipedia.org/wiki/Esquema_estrela
A coleção de itens de dados referida, composta de dados de medida e de contexto, é chamada Tabela de Fatos. A chave dessa tabela é uma combinação das chaves das Tabelas de Dimensão, que são tabela menores e que possuem chaves simples.
Aos não assinantes,
GABARITO: B
Tabela FATO: Medidas de negócio, medidas métricas quantitativas, valores ou indicadores (ex.: métricas de desempenho, quantidade, valor, lucro, margem, perda....)
Tabela DIMENSÃO: Entidade de negócio, armazenam atributos ou dimensões que descrevem/contextualizam medidas de uma tabela Fato.
Apresentam atributos qualitativos ou textuais (Ex: nome, sexo, data de nascimento...)
Na realidade é o inverso. As tabelas de dimensões não possuem chaves estrangeiras relativas às tabelas de fato.
Uma tabela de fato possui atributos relativos às chaves primárias das tabelas de dimensões, ou seja, estes atributos são chaves estrangeiras das tabelas de dimensão (e não chave estrangeira na tabela de dimensão).
O conjunto destas chaves estrangeiras forma a chave primária (ou parte da chave primária) da tabela de fato.
Gabarito: Errado.
É o contrário. A chave Estrangeira da tabela Fato (FK) relaciona-se com a chave Primária (PK) da tabela Dimensão.
OU, a chave primária de cada tabela de dimensões será uma chave estrangeira da tabela de fatos.
FAMOSA INTEGRIDADE REFERENCIAL: a CHAVE ESTRANGEIRA de uma tabela destino(tabela dimensão) será CHAVE PRIMÁRIA na tabela origem(tabela fato); se isso não for respeitado, a integridade está violada.
GAB) ERRADA
É exatamente o contrário. Uma tabela de fatos é geralmente composta por dois tipos de atributos: chaves estrangeiras que referenciam as dimensões e os próprios fatos (as medidas). A chave primária de uma tabela de fatos, então, é a dada pela composição das chaves estrangeiras que referenciam as dimensões.
Errado
As chaves primárias das tabelas dimensão são chaves estrangeiras na tabela fato.
Tabela Fato: armazena valores, medidas, cálculos; tabela central; elemento tempo; chave primária composta.
Tabela Dimensões: apresenta características pertinentes a dimensão em si; possui relacionamentos M:N entre eles; tabela(s) ao redor da central; chave primária simples.
Esquema Estrela: tabela dimensão desnormalizada; rápido tempo de resposta e simplicidade; menor nº de tabelas; consultas mais simples; não há economia de espaço; ligado diretamente com a tabela FATO
Esquema Flocos de Neve (snowflake): tabela dimensão normalizada; mais complexo; maior n° de tabelas; consultas mais complexas; menos eficientes do que no modelo estrela; suporte a hierarquias de atributos; AO MENOS UMA tabela NÃO está ligada diretamente a tabela fato.
Gabarito: Errado. Outras questões: Q929396, Q402738, Q842567, Q103251, Q869349, Q405051, Q925745, Q81743, Q883092, Q882067, Q841715, Q576136, Q607711
* As chaves primárias das tabelas de dimensão passam a ser chaves estrangeiras da tabela fato ;
* A Chave Primária da tabela fato é uma chave composta pelas chaves estrangeiras referentes às tabelas dimensão.
As Tabelas Fato condensa diversas referências às Tabelas Dimensão – em geral, a primeira possui chaves estrangeiras que referenciam chaves candidatas (em geral, chaves primárias) da segunda.
Prof. Diego Carvalho.
ERRADO.
A tabela fato armazena as chaves estrangeiras, as quais são primárias nas tabelas de dimensão.
A questão simplesmente inverteu os conceitos, a chave estrangeira na tabela FATO que corresponde a chave primária da tabela DIMENSÃO. Lembrando que a chave primária da tabela fato é sempre composta e da dimensão é simples.
Esquema Relacional em Estrela
A ‘caixa’ com o fato e seus atributos constituem a tabela de fatos.
Cada dimensão e suas hierarquias constituem uma tabela de dimensão.
Logo, os componentes são: a tabela de fatos, as tabelas dimensões (nas pontas das estrelas), os atributos (da tabela fato) e as hierarquias (da tabela dimensão).
Para cada tabela de dimensão é gerada uma chave primária (“surrogate key”).
A chave primária da tabela de fatos é a composição das chaves das tabelas de dimensão.
Gabarito Letra B
Tipos de modelos multidimensionais
Estrela (Star Schema) - possuem uma grande entidade central, chamada de Tabela Fato, e um conjunto de entidades menores (sem normas) denominadas Tabelas de Dimensões, arranjadas ao redor da Tabela Fato. Os relacionamentos entre Fato e Dimensões são simples ligações entre duas entidades em um relacionamento de "um para muitos" (1:N) no sentido da dimensão para o fato. É mais simples, mais rápida e os dados são redundantes (desnormalizados).
= AS chaves primárias das tabelas dimensões serão chave estrangeira na tabela fato.
Floco de Neve - é o resultado da decomposição de uma ou mais Tabelas de Dimensões. Nesse modelo, Tabelas Dimensionais relacionam-se com a Tabela de Fatos e algumas Tabelas de Dimensões relacionam-se apenas entre elas. De fato, esse modelo é o resultado da aplicação da terceira Forma Normal (3FN) sobre as entidades dimensão. É mais complexo, mais lento e os dados não são redundantes (normalizados).
bons estudos
O modelo dimensional envolve dois componentes principais: uma tabela de fatos e dimensões. Essas dimensões possuem atributos, que muitas vezes seguem uma organização hierárquica, por exemplo, as hierarquias de datas ou geográficas.
A redução da dimensionalidade de uma base de dados altamente correlacionados é objetivo da Análise
A Análise de Componentes Principais (ACP) ou Principal Component Analysis (PCA) é um procedimento matemático que utiliza uma transformação ortogonal (ortogonalização de vetores) para converter um conjunto de observações de variáveis possivelmente correlacionadas num conjunto de valores de variáveis linearmente não correlacionadas chamadas de componentes principais. O número de componentes principais é menor ou igual ao número de variáveis originais.
O pacote de software Weka (Waikato Environment for Knowledge Analysis) implementa uma biblioteca de Análise de Componentes Principais, além de outras técnicas de mineração de dados (data mining).
https://pt.wikipedia.org/wiki/Análise_de_componentes_principais
Gabarito: a)
NAO INTINDI NAAAAAAAADA !
Nos modelos de aprendizado de máquina, a utilização de muitas variáveis pode tornar o modelo complexo demais e fazer com que seu aprendizado não ocorra de forma satisfatória. A redução de dimensionalidade pode ser realizada de inúmeras maneiras, o que inclui métodos de fatorização ou decomposição de matrizes, como a análise de componentes principais (ACP ou PCA, em inglês).
Objetivo da ACP: Condensar a informação contida em diversas variáveis originais em um conjunto menor com uma perda mínima de informação.
Indicada para quando há grande número de variáveis correlacionadas, e se objetiva reduzir o n° de variáveis, sem perda significativa da informação.
Nos modelos de aprendizado de máquina, a utilização de muitas variáveis pode tornar o modelo complexo demais e fazer com que seu aprendizado não ocorra de forma satisfatória.
A redução de dimensionalidade pode ser realizada de inúmeras maneiras, o que inclui métodos de fatorização ou decomposição de matrizes, como a análise de componentes principais (ACP ou PCA, em inglês).
Explicação: https://www.youtube.com/watch?v=h-Xje7Klzw0
No que concerne à modelagem dimensional, julgue o item que se segue.
Um modelo dimensional é composto por uma tabela com uma
chave simples, denominada tabela de fatos, e um conjunto
de tabelas maiores, que contém chaves compostas, conhecidas
como tabelas de dimensão.
Um modelo dimensional simples é composto por uma tabela fato e várias tabelas dimensão. A chave da tabela fato é composta pela chave, geralmente artificial, de cada uma das dimensões. A chave artificial geralmente é uma chave simples.
http://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-tce-sc-auditor-tecnologia-da-informacao-bd-e-bi/
OK, mas qual o erro da questão então?
@Karina Yogi: o erro está em dizer que a chave da tabela fato é simples, quando é composta pelas chaves das tabelas dimensão.
Tudo errado,
Um modelo dimensional é composto por uma tabela com uma chave simples, denominada tabela de fatos, e um conjunto de tabelas maiores, que contém chaves compostas, conhecidas como tabelas de dimensão.
Um modelo dimesional é composto por chave composta, denominida da tabela fatos, e um conjunto de tabelas menores, que contém chaves simples, conhecidas como tabelas dimensão.
Importante ressaltar, a tabela fato é composta pela chave artificial e todas chave estrangeiras( chaves simples da tabela dimensão).
tabela de fato não é chave simples, é chave COMPOSTA
Tabela dimensão é chave primaria
As bancas gostam bastante de inverter os conceitos apresentados para confundir o candidato. Neste caso, as fatos é que possuem as chaves compostas pelas chaves estrangeiras que referenciam as dimensões, enquanto que as dimensões costumam possuir chaves substitutas.
CARACTERÍSTICAS DE TABELAS FATO
Armazenam ocorrências, eventos ou fatos de um processo de negócio da organização.
Possuem geralmente uma grande quantidade armazenada de registros ou tuplas.
São normalizadas e sem hierarquia (decomposições em outras tabelas).
São tabelas que geralmente crescem verticalmente: mais registros ou linhas.
Armazenam medidas/métricas quantitativas (valores ou indicadores).
Podem ser medidas de desempenho, métricas operacionais, medidas agregadas, etc.
Contêm chaves estrangeiras que correspondem às chaves primárias das Tabelas Dimensão.
Apresentam uma chave primária composta em que a dimensão tempo sempre é parte integrante.
Expressam, em geral, relacionamentos de 1:N entre as Tabelas Periféricas (Dimensão).
São efetivamente criadas apenas após a criação de tabelas dimensionais.
Respondem à pergunta: “O que está sendo medido nesse processo de negócio?”.
Exemplos: Quantidade, Valor, Lucro, Margem, Perda, entre outros.
CARACTERÍSTICAS DE TABELAS DIMENSÃO
Armazenam atributos ou dimensões que descrevem medidas de uma Tabela Fato;
Possuem geralmente menos linhas e mais colunas que Tabelas Fato;
São desnormalizadas e com hierarquia (decomposições em outras tabelas).
Possuem uma chave primária que identificam unicamente seus registros;
As chaves primárias das Tabelas Dimensão compõem a chave primária da Tabela Fato;
São tabelas que geralmente crescem horizontalmente: mais atributos ou colunas;
Apresentam atributos qualitativos ou textuais (Ex: Nome, Sexo, Data de Nascimento);
Permitem a visualização de fatos por meio de diversas perspectivas diferentes;
Atributos devem ser verbosos, descritivos, completos, discretos e corretos;
Respondem à pergunta: "Quando?", "O que?", "Onde?" e "Quem?";
Exemplos: Pessoas, Produtos, Lugares, Tempo, entre outros.
A Chave Primária da tabela fato é uma CHAVE COMPOSTA pelas Chaves Estrangeiras referentes às tabelas dimensão. Já as tabelas dimensão possuem UMA CHAVE PRIMÁRIA que identificam unicamente os seus registros.
TABELAS FATO: Apresentam uma chave primária composta em que a dimensão tempo sempre é parte integrante.
Prof. Diego Carvalho
Fato: chave primaria composta
Dimensão : chave primaria simples
A tabela fato possui uma chave primária, e esta é composta por chaves estrangeiras (com características dos eventos ocorridos, fazendo referência à chave primária) ligadas às dimensões. Já a tabela dimensão possui, apenas, uma única chave primária simples que identifica univocadamente seus registros.
Tabela fato é composta de várias chaves estrangeiras que são referenciadas pelas tabelas de dimensão. Estas últimas possuem as chaves primárias.
GABARITO E
Outra essa questão fresquinha sobre esse assunto. Bom para reforçar e complementar o conhecimento.
(CESPE 2020/ Min. Economia)
Uma tabela de fatos registra dados dimensionais que explicam os fatos registrados. ERRADO.
tabela fato: chave primária composta ligadas às dimensões. São normalizadas e sem hierarquia (decomposições em outras tabelas).
tabela dimensões: chave primária simples. São desnormalizadas e com hierarquia (decomposições em outras tabelas).
Fonte: copia e cola do qc.
A tabela fato armazena os eventos ocorridos decorrentes dos processos de negócio. As tabelas dimensão, por sua vez, contêm as características ou descrições das entidades de negócio.
A tabela de fatos possui uma chave primária composta e as tabelas de dimensão possuem uma chave primária simples. Apenas a tabela de fatos apresenta sempre o elemento tempo como parte da estrutura de sua chave.
ERRADO.
Três elementos básicos compõem o modelo multidimensional: (MACHADO, 2004)
· Fatos: é uma coleção de itens de dados composta de medidas. É utilizado para analisar o processo de negócio de uma empresa, refletindo assim a evolução dos negócios do dia-a-dia desta empresa. Ele é implementado em tabelas denominadas tabelas de fato (fact tables) e representado por valores numéricos;
· Dimensões: são os elementos que participam de um fato e que determinam o contexto de um assunto de negócios. As dimensões podem ser compostas por membros que podem conter hierarquias. Membros são as possíveis divisões ou classificações de uma dimensão. Por exemplo, a dimensão tempo, pode ser dividida nos seguintes membros: ano, trimestre e mês, e a dimensão localização em: cidade, estado e país;
· Medidas (variáveis): são os atributos numéricos que representam um fato, ou seja, representam o desempenho de um indicador de negócios relativo às dimensões que participam desse fato. Uma medida é determinada pela combinação das dimensões que participam de um fato e estão localizados como atributos de um fato. Por exemplo, o valor em reais das vendas, o número vendido de unidades de produtos e a quantidade em estoque.
FONTE: https://goo.gl/T7TMdI
Modelagem multidimensional:- É utilizada para sumarizar e reestruturar dados e apresenta-los em visões que suportem a análise de valores desses dados. É formado por fatos, dimensões e medidas.
Alternativa: D
Alternativa A: não existe esta restrição;
Alternativa B (GABARITO):
Uma tabela de fatos, ou simplesmente tabela-fato, contém uma grande quantidade de tuplas que correspondem aos fatos observados decorrentes de processos de negócios e links externos, sendo formada por atributos descritivos necessários para realizar a análise de decisões e relatórios de consulta.
Alternativa C:
Embora seja raro, um fato pode ser textual. Na maioria dos casos, uma medida textual é uma descrição de algo e é gerada a partir de uma lista discreta de valores.
Alternativa D:
Todas as tabelas de fatos têm duas ou mais chaves estrangeiras, que se conecta às chaves primárias das tabelas de dimensões
A própria tabela de fatos tem sua própria chave primária composta formada por um subconjunto das chaves estrangeiras
Alternativa E: não existe esta restrição
Fonte: Ramon Souza, Exponencial Concursos
Vunesp com suas assertivas absurdas! Até qm não estudou, consegue acertar!:(
Com relação aos conceitos de modelagem multidimensional de dados para inteligência computacional, julgue o seguinte item.
Diferentemente da estrutura relacional, a estrutura
multidimensional oferece baixa redundância de dados e suporte
a normalização até a segunda forma normal.
Sabemos que o modelo em estrela, mais utilizado no desenho ou projeto de bases de dados analíticas, utiliza-se de alta redundância e baixa normalização para apresentar um modelo de dados numa estrutura mais compreensiva para os usuários finais. Essa construção facilita ainda a navegação entre as diversas dimensões do modelo, facilitando a construção de relatórios. Podemos, então, concluir que a afirmação está incorreta.
Fonte: https://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-sedf-tecnologia-da-informacao-bd-e-bi/
ERRADO
Estrutura Relacional
Possui, alta redundância e permite Normalização
Baixa redundância -> Modelos normalizados (Relacional)
Alta redundância -> Modelos multidimensionais (Busca pesquisas mais rápidas, não precisa de normalização)
multidimensional me lembra muita informação... que me lembra redundância
A estrutura relacional diferencia-se da estrutura multidimensional principalmente devido a normalização, pouca redundância e a frequência de atualizações suportadas. A estrutura multidimensional possui, normalmente, desnormalização de tabelas, alta redundância e suporta periodicidade de atualizações de dados muito menor do que uma estrutura relacional convencional.
GABARITO: ERRADO
FONTE: Canaltech.com
A estrutura multidimensional é, geralmente, desnormalizada. O modelo snowflake permite que se tenha algumas dimensões normalizadas, mas esta não é a regra para a modelagem dimensional.
Errado, A estrutura relacional diferencia-se da estrutura multidimensional principalmente devido a normalização, pouca redundância e a frequência de atualizações suportadas. A estrutura multidimensional possui, normalmente, desnormalização de tabelas, alta redundância e suporta periodicidade de atualizações de dados muito menor do que uma estrutura relacional convencional.
https://canaltech.com.br/business-intelligence/entendendo-a-modelagem-multidimensional-19988/#:~:text=O%20OLAP%20possui%20um%20conjunto,de%20banco%20de%20dados%20multidimensional.
Gabarito: Errado.
Alta redundância...
ESTRUTURAL RELACIONAL
- Baixa Redundância
- Normalização (Diminui a redundância)
- Alta capacidade para atualizações frequentes na base de dados
ESTRUTURA DIMENSIONAL
- Alta Redundância
- DESNormalização (Tolera, permite alto grau de redundância)
- Baixa capacidade para atualizações frequentes na base de dados
ERRADO
MODELAGEM RELACIONAL (baixa redundância)
- Aplicações Transacionais
- Foco no nível operacional
- Modelo normalizado em todas as tabelas
- Dados voláteis e passíveis de alteração
- Modelo mais complexo
MODELAGEM MULTIDIMENSIONAL (alta redundância)
- Aplicações Analíticas
- Foco no nível estratégico
- Modelo desnormalizado
- Dados históricos e não voláteis
- Modelo mais simples e intuitivo
Com relação aos conceitos de modelagem multidimensional de dados para inteligência computacional, julgue o seguinte item.
A operação drill-across permite buscar informações que vão
além do nível de granularidade existente na estrutura
dimensional, desde que elas estejam unidas por dimensões
compatíveis.
Errado.
O Drill Across ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão.
Exemplo: a dimensão tempo é composto por ano, semestre, trimestre, mês e dia.
O usuário executa um drill across quando ele passar de ano direto para semestre ou mês.
Fonte: Tecnologia e projeto de Data Warehouse - Felipe Nery
erreii
fui de certa baseado nesta questao
entendi que dimensoes compartilhadas seria o mesmo que dimensoes compatíveis
2013
A operação OLAP que permite relacionar fatos diferentes através de dimensões compartilhadas é denominada
a)
pivoteamento.
b)
drill down.
c)
drill up.
d)
drill across.
e)
slice and dice.
A alternativa foi inspirada no livro do Carlos Barbieri, BI2: Business Intelligence. Segundo o autor, o comando de DRILL-ACROSS permite o tratamento das informações que, embora correlacionadas, estão em estruturas de esquema separadas, porém unidas por algumas dimensões coerentes. Funciona como uma operação de junção dimensional, entre estruturas relacionadas. Em outras palavras o comando DRILL-ACROSS faz uma equivalência entre esquemas dimensionais quando unidos por dimensões compatíveis. Vejam que não é está a definição descrita na questão, que portanto, está incorreta. O conceito da questão está associado ao termo DRILL-THROUGH.
O conceito de DRILL-THROUGH está relacionado com a ideia de você desejar uma informação em um nível de detalhe menor do que aquele colocado na tabela fato e permitido pala sua granularidade. Seria essa operação que permite uma busca de informações além do nível de granularidade existente na estrutura dimensional.
Fonte: https://www.estrategiaconcursos.com.br/blog/prova-da-semana-comentario-da-prova-do-sedf-tecnologia-da-informacao-bd-e-bi/
ERRRADO
Basta Gravar: Drill-Across é SEMPRE NA MESMA DIMENSÃO
Se você ir para outra dimensão estará dando um DRILL-TRHOUGHT
Não sei o que é pior: um cara que coloca um inútil comentário em inglês ou quem o classifica como útil...
Segue uma dica para não ter erro:
Drill-Throught: ocorre quando o usuário passa de uma informação contida em uma dimensão para outra.
Drill-across: significa mudar de uma classificação em uma dimensão para outra em uma dimensão diferente.
(ERRO EM VERMELHO) A operação drill-across permite buscar informações que vão além do nível de granularidade existente na estrutura dimensional, desde que elas estejam unidas por dimensões compatíveis.
---------------------------------------------------------------------------------------------------------------
Drill Across
-Executa uma consulta envolvendo mais de uma tabela fato.
-Ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão.
-Essa operação exige que os dois cubos tenham pelo menos uma das dimensões em comum.
-A ideia é você conseguir consultar as múltiplas tabelas fato e colocar o resultado em um único data set.
Drill Throught
-Ocorre quando o usuário passa de uma informação contida em uma dimensão para uma outra.
-Exemplo: Inicia na dimensão do tempo e no próximo passo analisa a informação por região.
- Permite as empresas acesso aos dados que não estão armazenados no servidor OLAP, fazendo-as acessíveis para os usuários finais das aplicações OLAP
–Esses dados podem vir tanto do DW quanto das bases transacionais.
---------------------------------------------------------------------------------------------------------------
Fonte: Minhas anotações
O erro da questão é dizer que o drill-across busca informações além da granularidade existente na estrutura dimensional. Essa operação conjuga métricas de diversas fatos em um mesmo nível de agregação, desde que elas estejam unidas por dimensões compatíveis.
Operações OLAP:
- Drill Down = permite a navegação entre os níveis de dados que vão desde o mais sumarizado (genérico) até o mais detalhado, permitindo visualizar dados detalhados, até o menor nível de granularidade da tabela de fatos. Apresenta dados do nível mais alto da hierarquia para níveis mais baixos.
- Roll Up (Drill Up) = permite a navegação entre os níveis de dados que vão desde o mais detalhado até o mais sumarizado (genérico). É o operador que se relaciona ao processo de apresentar dados do nível mais baixo da hierarquia de dados de um esquema para níveis mais altos.
- Drill-Across = permite ao usuário pular um nível intermediário dentro de uma mesma dimensão.
- Drill-Through = permite atravessar de uma informação contida em uma dimensão para uma informação contida em outra dimensão. Permite buscar informações que vão além do nível de granularidade existente na estrutura dimensional.
- Slice-and-Dice = tem como função extrair sub-cubos a partir de seleções e projeções. A Operação Slice permite ao usuário recuperar um subconjunto geralmente bidimensional de uma matriz multidimensional que corresponde a um valor simples atribuído a uma ou mais dimensões. Ou seja, executa uma seleção em uma dimesão do cubo. Já a Operação Dice permite ao usuário recuperar um subconjunto geralmente tridimensional de uma matriz multidimensional de acordo com algum critério específico. Ou seja, executa a seleção em duas ou mais dimensões.
- Pivot (Rotação) = permite ao usuário realizar uma alteração de uma hierarquia ou orientação dimensional para outra (Tabulação transversal) (Ex: inverter as dimensões entre linhas e colunas, e rotacionar eixos de um cubo provendo uma visão alternativa dos dados, permitindo a visão de suas várias faces).
MUITA INFORMAÇÃO CONTRADITÓRIA AQUI NOS COMENTÁRIOS.
Aqui vai a explicação do TEC Concursos pra essa questão:
Vejamos o conceito de DRILL-ACROSS segundo BARBIERI (2011):
"está relacionado com a ideia de você poder 'pular' de um esquema para outro, desde que ambos tenham algumas dimensões em conformidade, ou seja, as mesmas dimensões estão compartilhadas. (...). O DRILL-ACROSS faz o equivalente entre esquemas dimensionais, quando unidos por dimensões compatíveis."
Vejamos agora o conceito de DRILL-THROUGH segundo o mesmo autor:
"O conceito de DRILL-TROUGH está relacionado com a ideia de você desejar uma informação em nível de detalhe menor do que aquele colocado na tabela fato e permitido pela sua granularidade. (...) O DRILL-TROUGH permite uma busca de informações além do nível de granularidade existente na estrutura dimensional".
Assim, podemos ver que a operação que vai além do nível de granularidade é o DRILL-THROUGH, e não o DRILL-ACROSS.
Logo, a questão está ERRADA.
drill-across: dentro da mesma dimensão.
ERRADO
- Drill Across - dentro de uma mesma dimensão
- Drill Through - de uma dimensão para outra
Operação Drill Down: você vai aumentar o nível de detalhes, descendo na hierarquia das dimensões e reduzindo a granularidade.
Operação Roll Up/Drill UP: você vai reduzir o nível de detalhes, subindo na hierarquia das dimensões e aumentando a granularidade.
Operação Drill-Across: PULA O DETALHE o pular um nível intermediário de detalhe dentro de uma mesma dimensão. Exemplo: pula de país para bairro.
Operação Drill-Through: OUTRA DIMENSÃO atravessa uma informação contida em uma dimensão para uma informação contida em outra dimensão. Exemplo: atravessar de mês para cidade.
Operação Slice-and-Dice:
Slice: É como se fatiássemos um cubo gerando um resultado com apenas duas dimensões – slice é fatiar, em inglês. bidimensional.
DICE: permite ao usuário recuperar um subconjunto geralmente tridimensional de uma matriz multidimensional de acordo com algum critério específico. GERA UM SUBCUBO A PARTIR DE UM CUBO MAIOR.
Operação Pivot (Rotação): alteração de uma hierarquia ou orientação dimensional para outra (Ex: inverter as dimensões entre linhas e colunas), nova visão da mesma fatia..
O que você sabe é uma gota, o que ignora é um oceano.
ass: Informática
Para : Letícia
GAB. ERRADO
Drill Across = dentro de uma mesma dimensão.
Drill Through = de uma dimensão para outra.
Com relação aos conceitos de modelagem multidimensional de dados para inteligência computacional, julgue o seguinte item.
Ao se modelar uma tabela-fato, deve-se considerar que a chave
primária é composta e que a dimensão tempo sempre será parte
integrante dessa chave.
Na modelagem dimensional, a chave primária da tabela-fato é composta pelas chaves primárias das tabelas-dimensão que estão ligadas diretamente a essa fato. Além disso, toda tabela-fato deve ter uma dimensão tempo associada a ela. Dessa forma podemos afirmar que a questão está correta.
cespe SEMPRE cobra isso
Tempo é uma dimensão importante que TODOS os DW's devem suportar
Dimensão tempo é sempre representada como parte da chave primária
Questão conceito, ou seja, GRAVEM!
Segundo esta fonte [1], essa questão tá certa!!!
Segundo esta outra [2], tá errada!!!
Eles[1] justificam que "o texto afirma explicitamente que a dimensão tempo fará parte da tabela fato, sendo isso incorreto. Eles não justificam muito além disso, mas dá pra inferir q é na parte q "o texto afirma explicitamente que a dimensão tempo fará parte da tabela fato", e afirmam q faltou explicitar a Tabela fato!
E jogam o abacaxi para as mãos do aluno: "Sugiro que você organize os recursos". Ou seja, te vira, dá teus pulos no google.books, escholar etc!!!
Já esta terceira [3] diz q tá certa!!!
Tá mais parecendo aquele episodio do disco voador do Chaves...já chegou o disco voadorrrr; não, já se foi; não já chegou; já se foi, já chegou, já se foi....kk. Aqui está o video:
https://www.youtube.com/watch?v=l9vJSVn1_QU
Nem mesmo eles se entendem....que dirá os alunos!!!
Fonte:
[1] Ponto dos concursos.
[2] Estratégia
[3] Exponencial
Toda Tabela Fato deve conter uma dimensão tempo, já que a dimensão é parte da chave composta.
outra questão:
Ano: 2017 Órgão: TCE PE Provas: AUDITOR
A respeito da modelagem dimensional, julgue o próximo item.
Todas as tabelas de um modelo apresentam um elemento de tempo como parte da estrutura de chave.
ERRADO, só a tabela de fato
Galera, gravem que a chave primária da TABELA-FATO é sempre COMPOSTA, seguem questões que eu vi que cobraram isso:
(TRT/MS – 2017) Uma das formas de apresentação de um banco de dados multidimensional é através do modelo estrela. No centro de um modelo estrela encontra-se a tabela de:
a) dimensão e, ao seu redor, as tabelas de fatos.
b) dimensão, cuja chave primária deve ser composta.
c) núcleo e, ao seu redor, as tabelas de nível.
d) fatos, cuja chave primária deve ser simples. (A chave primária da tabela-fato deve ser composta)
e) fatos e, ao seu redor, as tabelas de dimensões.
Resp: E
(TCE/SC - 2016) Um modelo dimensional é composto por uma tabela com uma chave simples, denominada tabela de fatos, e um conjunto de tabelas maiores, que contém chaves compostas, conhecidas como tabelas de dimensão. (A tabela-fato deve conter chave composta)
Gab. Errado
Rolap - Olap Relacional: Ferramentas OLAP que acessam bancos de dados relacionais
Molap - Olap Multidimensional : Ferramentas OLAP que acessam banco de dados multidimensionais por meio de cubos e hipercupos
Holap - Olap Híbrido: Ferramenta OLAP que permitem acesso tanto aos bancos de dados relacionais como multidimensionais
Somete a 1 está errada.
Fonte:
Tecnologia e Projeto de Data Warehouse - Machado
De acordo com a definição do Rodrigo Marcelo, a 1 estaria correta também.
Rodrigo Marcelo,
A assertiva I está correta também, segue abaixo:
" Alguns produtos combinam as abordagens de ROLAP e MOLAP formando o OLAP HÍBRIDO (HOLAP)" (Date)
Att,
Acredito que o erro esteja em "utilizando técnicas ou" na primeira afirmativa.
Um modelo de banco de dados multidimensional está mais fortemente relacionado com data warehouse.
Alternativa: A
Árvore B
Não adequada para índice
Tem-se a tabela fato como centro do modelo, com várias dimensões ao seu redor. Gabarito alternativa E
Só para enriquecer os comentários
d) fatos, cuja chave primária deve ser simples.
Errada. Pois a tabela fatos está relacionada à Chave Estrangeira - FK
Gabarito LETRA E.
No esquema estrela (star scheme) a tabela FATO fica ao centro, sendo ligada a pelo menos 2 tabelas DIMENSÃO. Além disso, vale dizer que a chave primária da tabela FATO é sempre composta/concatenada, eliminando então a possibilidade da letra D ser o gabarito da questão.
Questão fácil! Você já sabe que, no modelo dimensional, a tabela fato está no centro do modelo e as dimensões ficam ao redor. O interessante dessa questão é só comentar que a chave primária das dimensões deve ser simples e substituta, como diz Kimball, enquanto que as chaves primárias das fatos são compostas pelas chaves estrangeiras que referenciam as dimensões.
Gabarito: E
A respeito da modelagem dimensional, julgue o próximo item.
No modelo floco de neve (snow flake), todas as tabelas estão
relacionadas diretamente com a tabela de fatos, e as tabelas
dimensionais devem conter todas as descrições necessárias
para definir uma classe nelas mesmas.
Comentário: Essa alternativa nós falamos sobre ela na revisão de ontem. O modelo floco de neve possui pelo menos uma dimensão normalizada, ou seja, ao menos uma tabela não está ligada diretamente a tabela fato. Sendo assim, temos mais uma alternativa incorreta.
Gabarito Preliminar: E. Gabarito Oficial: E.
2015
Uma vez que os esquemas floco de neve possuem menor redundância do que os esquemas estrela, sua manutenção é mais fácil de ser realizada.
Certa
No esquema floco de neve, as dimensões podem estar representadas por mais de uma tabela e, portanto, determinadas tabelas podem estar ligadas a tabelas dimensão e não diretamente a tabelas fato. No esquema flocos de neve, as tabelas dimensão são organizadas em uma hierarquia gerada a partir da normalização, geralmente, até a terceira forma normal. Assim, o esquema floco de neve é resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros.
Os Modelos Snowflake acrescentam graus de normalização às tabelas de dimensões do Modelo Estrela, eliminando redundâncias e a necessidade do indicador NÍVEL.
No modelo Floco as tabelas dimensionais relacionam-se com a tabela de fatos, mas algumas dimensões relacionam-se apenas entre elas, isto ocorre para fins de normalização das tabelas dimensionais, visando diminuir o espaço ocupado por estas tabelas
Falso. A característica do modelo floco de neve é justamente a existência de dimensões ligadas a outras dimensões, em obediência à terceira forma normal.
Gabarito: E
Se a questão trocasse "floco de neve (snow flake)" por modelo estrela ela estaria correta!
Generalizar na Internet é fria. (TODAS)
todas > generalizou
O ESQUEMA FLOCOS DE NEVE É BASICAMENTE UMA TABELA DE FATOS CENTRAL CONECTADA A VÁRIAS TABELAS DE DIMENSÃO, SENDO POSSÍVEL HAVER VÁRIAS TABELAS PARA CADA DIMENSÃO.
GABARITO: ERRADO.
DIEGO CARVALHO.
A respeito da modelagem dimensional, julgue o próximo item.
Todas as tabelas de um modelo apresentam um elemento de
tempo como parte da estrutura de chave.
Essa questão nós falamos sobre ela em vários momentos do nosso curso. É sabido que a dimensão tempo, pelo contexto analítico do DW, está presente nos modelos. Contudo, é importante perceber que a dimensão tempo é apenas uma das tabelas dimensões do seu modelo. A chave primária da dimensão tempo é referenciada por uma chave estrangeira na tabela fato. Sendo assim, a alternativa está incorreta, pois, apenas a tabela de dimensão tempo e a tabela fato possuem elementos de tempo como parte da sua estrutura.
Ou anula a questão ou troca o gabarito para C. Não existe modelagem dimensional em que todoas as tabelas dimensão apresentem um elemento de tempo.
Questão está errada
cai no peguinha
Dimensão de TEMPO está sempre presente
ERRADA
O Gabarito Final foi alterado e a questão provavelmente anulada.
No tocante a questão o correto seria: Toda Tabela Fato deve conter uma dimensão tempo, já que a dimensão é parte da chave composta
Gabarito E: Apenas as tabelas fato.
O CESPE costuma considerar que toda fato tem uma chave estrangeira referenciando a dimensão temporal, então as chaves primárias dessas fatos teriam sim, em sua composição, o elemento tempo. Contudo, o mesmo não se aplica às dimensões. Kimball recomenda que se use chaves substitutas, que não possuem nenhum significado implícito.
É sabido que a dimensão tempo, pelo contexto analítico do DW, está presente nos modelos. Contudo, é importante perceber que a dimensão tempo é apenas uma das tabelas dimensões do seu modelo. A chave primária da dimensão tempo é referenciada por uma chave estrangeira na tabela fato. Sendo assim, a alternativa está incorreta, pois, apenas a tabela da dimensão tempo e a tabela fato possuem elementos de tempo como parte da sua estrutura.
Apenas a tabela de fatos apresenta sempre o elemento tempo como parte da estrutura de sua chave. E não "todas as tabelas" como trouxe a questão.
Apenas a tabela de fatos apresenta sempre o elemento tempo como parte da estrutura de sua chave.
A tabela de fatos possui uma chave primária composta e as tabelas de dimensão possuem uma chave primária simples.
Uma tabela de fato armazena o que tiver ocorrido, e a tabela de dimensão contém as características descritivas de um evento.
É gelada generalizar na Internet !! (TODAS)
ERRADO
tabela fato: armazena valores, medidas, cálculos... São normalizadas e sem hierarquia (decomposições em outras tabelas). A ÚNICA QUE POSSUI ELEMENTO DE TEMPO.
Julgue o próximo item, relativo à modelagem dimensional.
No modelo estrela, os dados são modelados em tabelas
dimensionais, ligadas a uma tabela fato; uma tabela dimensão
armazena o que tiver ocorrido, e a tabela fato contém as
características de um evento.
Nesta questão o CESPE inverteu a definição das tabelas. O modelo estrela, de fato, apresenta diversas dimensões ligadas a uma tabela fato. Contudo, a tabela fato contém os eventos, as medidas ou os fatos ocorridos. Já as dimensões armazenam as características que descrevem o evento. Alternativa, portanto, incorreta.
2010
A tabela de fatos armazena todos os eventos ocorridos na empresa, possibilitando ao gestor a consulta de todo o seu histórico.
Errada
Ano: 2014 Banca: CESPE
Na modelagem multidimensional, é possível haver mais de uma tabela fato no mesmo modelo. A tabela fato expressa a relação N:M (muitos-para-muitos) entre as dimensões, que, por sua vez, implementam a visão e a interface do usuário ao DataWarehouse.
Certa
2015
Uma tabela de fatos em um data warehouse armazena os valores detalhados de medidas, ou de valores observados, e as identifica com ligação para tabelas de dimensão.
Certa
O modelo ou esquema estrela tabela fato central conectada a várias tabelas dimensão. No entanto, a questão inverteu os conceitos de tabela fato e tabela dimensão. A tabela fato armazena os eventos ocorridos decorrentes dos processos de negócio. As tabelas dimensão, por sua vez, contém as características ou descrições das entidades de negócio.
Propriedades do esquema em estrela
Uma única tabela de factos contendo dados, sem redundância. Uma tabela por dimensão. As chaves primárias, da tabela de factos, são apenas de uma por dimensão. Cada chave é gerada (eficiência) Cada dimensão representa um única tabela, altamente desnormalizada.
Vantagens
A simetria do desenho e a simplicidade semântica faz com que este modelo disponibilize ao utilizador comum toda a informação necessária sobre o funcionamento da sua organização, o reduzido número de joins beneficia o desempenho e tudo isto faz com que este modelo tenha uma baixa e fácil manutenção.
Desvantagens
Não fornece explicitamente suporte para hierarquias de atributos e as tabelas dimensionais são um problema. As tabelas de dimensão, por não estarem normalizadas, contém repetição das informações. Não são adequadas para uso transaccional pois uma alteração simples (como de o nome de um país) poderia gerar a necessidade de várias alterações no banco de dados (para todas as linhas de municípios).
O examinador simplesmente inverteu os conceitos. A tabela fato armazena as ocorrências dos eventos e as dimensões as características.
Direto ao ponto: a tabela FATO armazena FATOS
Os conceitos foram invertidos, simples.
CESPE-TCEPE2017) No modelo estrela, os dados são modelados em tabelas dimensionais, ligadas a uma tabela fato; uma tabela dimensão armazena o que tiver ocorrido, e a tabela fato contém as características de um evento. ERRADO
Obs: Vermelho=erro
Tabela fatos: armazena valores, medidas, cálculos...
Tabela dimensões: apresenta características pertinentes a dimensão em si.
@rotinaconcursos
O Esquema Estrela é basicamente uma Tabela de Fatos central conectada a várias Tabelas de Dimensão em um relacionamento 1:N, sendo uma única tabela para cada dimensão.
Uma característica importante desse modelo é que as Tabelas de Dimensão são desnormalizadas, isto é, possuem dados redundantes. Porque a redundância – em bancos de dados multidimensionais – ajuda a melhorar o desempenho de consultas.
FONTE: Prof Diego Carvalho (Estratégia)
Uma tabela de FATO ARMAZENA O QUE TIVER OCORRIDO, e a tabela de DIMENSÃO CONTÉM AS CARACTERISTICAS DESCRITIVAS DE UM EVENTO.
ERRADO
O desempenho do modelo Snowflake é pior que o do modelo Estrela, justamente por causa da normalização. Sem as redundâncias, as consultas envolvem um número maior de tabelas para acessar, o que acaba deixando a performance mais lenta.
- ESTRELA -> NÃO NORMATIZADA
- FLOCO DE NEVE -> NORMATIZADA
A tabela fato armazenar eventos, e as tabelas dimensões armazenarem características do evento, é válido também para o esquema flocos de neve ou apenas para o esquema estrela ?
ERRADO
O Esquema Estrela é basicamente uma Tabela de Fatos central conectada a várias Tabelas de Dimensão em um relacionamento 1:N, sendo uma única tabela para cada dimensão.
No modelo estrela, os dados são modelados em tabelas dimensionais, ligadas a uma tabela fato; uma tabela FATO armazena o que tiver ocorrido, e a tabela DIMENSÃO contém as características de um evento.
A modelagem dimensional é uma técnica de projeto de banco de dados capaz de suportar, em um data warehouse, consultas de usuários finalísticos ligados a um negócio. Conceitos como tabela-fato, tabela agregada e métricas fazem parte da modelagem dimensional. A respeito dessa modalidade de modelagem, julgue os itens a seguir.
I Uma tabela-fato armazena, para fins estatísticos, as medições de desempenho.
II A tabela agregada é composta de atributos e contém a descrição do negócio.
III A tabela agregada é utilizada para reduzir o tempo de acesso de uma consulta ao banco de dados.
IV Métricas são as informações que se armazenam em tabela-fato e permitem medir o desempenho dos processos do negócio.
V As métricas não aditivas, assim como os valores percentuais ou relativos, podem ser manipuladas livremente.
Estão certos apenas os itens
I- Incorreto: Uma tabela-fato armazena, para fins estatísticos, as medições de desempenho.
Os atributos de análise de decisão das tabelas fato consistem em medidas de desempenho, métricas operacionais, medidas agregadas e todas as outras métricas necessárias para analisar o desempenho da organização.
II- Incorreto: A tabela agregada dimensão é composta de atributos e contém a descrição do negócio.
A tabela agregada é criada com dados da tabela fato, alterando sua granularidade, ou seja, ela sumariza os dados, gerando uma tabela menor.
As tabelas de dimensão representam entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente. As tabelas de dimensão geralmente representam relacionamentos hierárquicos no negócio (por exemplo, produtos se associam a subcategorias que se associam a categorias). Dizemos que elas possuem característica qualitativa dentro de um DW.
III- Correto: A tabela agregada é utilizada para reduzir o tempo de acesso de uma consulta de banco de dados.
A tabela agregada é utilizada para otimizar o tempo de acesso de uma consulta ao banco de dados. É importante avaliar bem o ambiente para definir quais agregações devem ser criadas; a utilização das mesmas requer um esforço adicional de manutenção, além de aumentar o gasto com armazenamento, por isso deve-se sempre tentar criar tabelas agregadas que atendam a múltiplas consultas.
IV- Correto: Métricas são as informações que se armazenam em tabela-fato e permitem medir o desempenho dos processos do negócio.
Métricas (por vezes chamadas de medidas ou fatos) são as informações armazenadas nas tabelas fato que permite medir o desempenho dos processos do negócio. As métricas são geralmente volumétricas, numéricas, podem ou não ser agregadas e na maioria das vezes são do tipo aditivas, ou seja, permitem operações como adição, subtração e médias. Existem também outros dois tipos de métricas, as métricas não aditivas e as semi-aditiva.
V- Incorreto: As métricas não aditivas, assim como os valores percentuais ou relativos, podem ser manipuladas livremente.
As medidas não-aditivas ou fatos não-aditivos não podem ser adicionados. Em geral, para agregar as linhas é necessário percorrer uma linha por vez. Ex.: porcentagem de vendas.
https://www.exponencialconcursos.com.br/tce-pb-comentarios-prova-de-analise-de-informacoes-gabarito-extraoficial/
No link que você passou a questão I está correta.
Justificativa para anulação
http://www.cespe.unb.br/concursos/TCE_PB_17/arquivos/TCE_PB_17_JUSTIFICATIVAS_DE_ALTERA____ES_DE_GABARITO.PDF
Q98. A redação do item I permite dupla interpretação, fato que prejudicou o julgamento objetivo da questão.
I. Na minha opinião, esta alternativa está correta. Uma tabela fato armazena vários tipos de medições, incluindo medições de desempenho, para diversos fins, incluindo fins estatísticos. A banca inicialmente deu o gabarito como errada, mas depois considerou que a redação era ambígua e anulou o item. ANULADA
II. Uma tabela agregada é uma fato. A agregação dos registros da fato, como ocorre nas fatos de Snapshot Periódico, é uma técnica que visa reduzir a quantidade de registros nessa tabela, melhorando a performance de consulta. ERRADA
III. Como acabei de explicar, as tabelas fato agregadas melhoram a performance de consulta, reduzindo assim o tempo de acesso. CERTA
IV. As métricas são armazenadas nas fatos e permitem realizar diversas medições a respeito do negócio, incluindo o desempenho dos processos. CERTA
V. Não! As métricas não aditivas não podem ser somadas ou subtraídas umas das outras no momento da agregação. Portanto, elas não podem ser manipuladas livremente. ERRADA
Gabarito: I, III e IV (ANULADA)
Acompanho o voto do professor sobre o item I ser correto. Tanto que ele é muito parecido com o item III, que foi justamente considerado correto.
Com relação à modelagem dimensional e à otimização de bases de dados para business intelligence, julgue o item subsequente.
O modelo snowflake acrescenta graus de normalização às
tabelas de dimensões, eliminando redundâncias; em termos de
eficiência na obtenção de informações, seu desempenho é
melhor que o do modelo estrela, o qual, apesar de possuir um
único fato, possui tamanho maior que o do snowflake,
considerando-se a desnormalização das tabelas de dimensões.
O gabarito é Errado.
O desempenho do modelo Snowflake é pior que o do modelo Estrela, justamente por causa da normalização. Sem as redundâncias, as consultas envolvem um número maior de tabelas para acessar, o que acaba deixando a performance mais lenta.
Seu desempenho é pior do que o modelo estrela
O erro está em afirmar que o desempenho é melhor. Na verdade é inferior ao Star Schema, devido à normalização dos dados.
2014
O Data Warehouse tem como principal objetivo armazenar dados históricos por meio dos esquemas snow flake ou star schema. O primeiro armazena os dados em dimensões que podem não estar ligadas diretamente à tabela fato; o segundo é voltado para armazenamento de dados não estruturados ou textuais.
errada
Ano: 2014 Banca: CESPE
Na modelagem multidimensional, é possível haver mais de uma tabela fato no mesmo modelo. A tabela fato expressa a relação N:M (muitos-para-muitos) entre as dimensões, que, por sua vez, implementam a visão e a interface do usuário ao DataWarehouse.
Certa
2015
Na modelagem dimensional, implementada em sistemas de data warehouse, o esquema snowflake caracteriza-se por possuir diversas tabelas de fatos e de dimensões, sendo estas últimas organizadas hierarquicamente na terceira forma normal (3FN).
errada
snowflake tem menor redundância que o esquema estrala
Estrela
- Tabela Dimensão Desnormalizada
- Rápido tempo de resposta e simplicidade
-Menor nº de tabelas
-Consultas mais simples
Flocos de Neve
-Tabela dimensão normalizada
- Mais complexo
-Maior n° de tabelas
-Consultas mais complexas
Há dois erros aqui: dizer que o desempenho do snowflake é melhor que o do esquema estrela na recuperação de informações e que o esquema estrela é maior que o snowflake, quando consideramos o grau de normalização das tabelas.
Quando estamos falando de modelagem dimensional, a regra é basicamente a seguinte:
Esquema estrela -> dimensões desnormalizadas -> modelo menor e mais simples, com menos tabelas -> mais redundâncias (ocupa mais espaço em disco), porém melhor performance de leitura
Esquema snowflake -> uma ou mais dimensões normalizadas -> modelo maior e mais complexo, com mais tabelas -> menos redundâncias de dados, porém pior performance de leitura
Observe que há um trade-off, uma escolha, entre ter um modelo mais simples, com menos tabelas e melhor performance de leitura, e ter um modelo mais complexo, porém com menos redundâncias de dados. A escolha de adotar ou não uma abordagem snowflake vai sempre depender de cada cenário específico.
- No Modelo Estrela os dados estão desnormalizados, isto é, estão redundantes e replicados, logo não há economia de espaço.
- O Modelo Snowflake acrescenta graus de normalização às tabelas de dimensões, eliminando redundâncias. No entanto, como os dados estão normalizados, as consultas são mais complexas e a obtenção de informações será menos eficientes do que no Modelo Estrela. Esse modelo fornece explicitamente suporte a hierarquias de atributos.
O modelo snowflake acrescenta graus de normalização às tabelas de dimensões, eliminando redundâncias; em termos de eficiência na obtenção de informações, seu desempenho é melhor que o do modelo estrela, o qual, apesar de possuir um único fato, possui tamanho maior que o do snowflake, considerando-se a desnormalização das tabelas de dimensões.
O modelo estrela possui melhor desempenho em relação ao modelo flocos de neve
Em contraste com o esquema estrela, apresenta consultas mais complexas, mais lentas, mas com manutenção mais fácil. Como as tabelas são normalizadas, existe menos redundância de dados, portanto ocupa-se menos espaço. Além disso, como há tabelas de dimensão conectadas a outras tabelas de dimensão, existe uma hierarquia
O Modelo Snowflake realmente acrescenta graus de normalização às tabelas de dimensões,
eliminando redundâncias. No entanto, como os dados estão normalizados, as consultas são mais
complexas e a obtenção de informações será menos eficientes do que no Modelo Estrela.
Gabarito: Errado
ERRADO
- ESTRELA -> NÃO NORMATIZADA
- FLOCO DE NEVE -> NORMATIZADA
A consulta no modelo estrela é mais eficiente. É só pensar na visualização dos dois modelos... Quando vc faz a normalização, acaba criando mais tabelas, então a quantidade de joins será maior, a consulta será mais complexa que no modelo estrela.
ERRADO
O snow flake ou floco de neve tende a ter pior desempenho nas consultas visto que esse esquema é normalizado. O esquema estrela ou star schema não é normalizado.
Fatos
Coleção de itens de dados composta de dados de medidas e de contexto.
Valor aditivo
Métrica
Expressam relação muitos-para-muitos
Letra D
CARACTERÍSTICAS DE TABELAS FATO
Armazenam ocorrências, eventos ou fatos de um processo de negócio da organização.
Possuem geralmente uma grande quantidade armazenada de registros ou tuplas.
São normalizadas e sem hierarquia (decomposições em outras tabelas).
São tabelas que geralmente crescem verticalmente: mais registros ou linhas.
Armazenam medidas/métricas quantitativas (valores ou indicadores).
Podem ser medidas de desempenho, métricas operacionais, medidas agregadas, etc.
Contêm chaves estrangeiras que correspondem às chaves primárias das Tabelas Dimensão.
Apresentam uma chave primária composta em que a dimensão tempo sempre é parte integrante.
Expressam, em geral, relacionamentos de 1:N entre as Tabelas Periféricas (Dimensão).
São efetivamente criadas apenas após a criação de tabelas dimensionais.
Respondem à pergunta: “O que está sendo medido nesse processo de negócio?”.
Exemplos: Quantidade, Valor, Lucro, Margem, Perda, entre outros.
Bizu
A)Existem 6 tipos de Fatos
Fato transacional->Mais comuns, usam métricas aditivas que pode se somar por todas dimensões;
Fato agregada-> Função acelerar o desempenho das consultas, consolidam Coisas;
Fato consolidada->Diferente da tabela agregada server para consolidar duas fatos(no processo ETL as duas fatos são carregadas e misturadas);
Fato snapshot periódico->Baseada no tempo, seja data,dia , semana ou hora(pega um momento períodico, tira uma fotografia e insere no fato);
Fato de snapshot acumulado - >também é uma fotografia entretanto em mais de um momento;
Fato sem fato(factless fact table)-> Fato sem métricas, serve para fazer intersecção de dimensões, cruzamento para comparações, pode inserir fatos fakes sem conteúdo apenas para cruzamento entre dimensões.
B)Dimensão e Fato são obrigatórias e se complementam- São Tabelas !
Tabela Fato armazena as métricas e ass chaves estrangeiras
C)Mode Estrela (Star Schema) -> As Dimensões não são normalizadas !
D)Modelo floco de neve(SnowFlake) -> Diferente do modelo start Schema a tabela é NORMALIZADA tendo um desempenho pior pois aumenta o número de tabelas com a normalizaçã, consequencia seria aumentatr o espaço de armazenamento mas fiquei em dúvida nessa alternativa.
E) não compreendi.
Não vejo erro na alternativa D.
d) O modelo floco de neve (SnowFlake) aumenta o espaço de armazenamento dos dados dimensionais, pois acrescenta várias tabelas ao modelo, todavia torna mais simples a navegação por software que utilizarão o banco de dados.
Não torna nada de mais simples justamente pelo fato das tabelas dimensões serem normalizadas nesse modelo, então quanto mais tabelas mais dificil a navegação e menos desempenho.
e) Os códigos e as descrições associadas, usadas como nomes de colunas em relatórios e como filtros em consultas, não devem ser gravados em tabelas dimensionais.
Aqui ta dizendo que os valores dos atributos descritivos não devem ser gravados em tabelas dimensionais, hora se essas descrições não forem gravas como iremos analisar um fato? Para isso existem as tabelas dimensões para gravar esses valores
É importante deixar claras as diferenças entre os modelos estrela e snowflake:
1. Star Schema (Estrela): Mais popular, mais rápido, com uma tabela por dimensão. É menos flexível e desperdiça espaço, pois repete as mesmas descrições ao longo de toda a tabela. Possui uma tabela de fato e várias tabelas para cada dimensão, e propõe uma visão com a presença de dados redundantes nas tabelas de dimensão.
· Normalização: Não normaliza as dimensões.
· Espaço de armazenamento: Alto, pois por não haver normalização das tabelas, há muitos registros duplicados.
· Integridade: Mais propensa a problemas de integridade dos dados, devido a duplicação, dificultando futuras modificações e manutenções.
· Complexidade de query: Menos tabelas. Não há necessidade de relacionar muitas tabelas diferentes, logo a consulta é mais fácil.
· Utilização: Data mart, pois o espaço de armazenamento exigido é pequeno e busca-se facilidade nas consultas de query.
2. Snowflake Schema (Floco de Neve): Variação do modelo estrela. Ele reduz o espaço de armazenamento, mais flexível, porém mais lento. Apresenta o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros.
· Normalização: Tabelas de dimensão são normalizadas.
· Espaço de armazenamento: Reduzido, pois a normalização reduz a quantidade de registros redundantes.
· Integridade: Maior facilidade para realizar futuras modificações e manutenções, pois há pouca redundância de dados.
· Complexidade de query: Por haver mais tabelas as consultas são maiores e mais complexas.
· Utilização: Data warehouse, pois dessa forma é possível economizar muito espaço de armazenamento.
Aos não assinantes,
GABARITO: A
a) Isso mesmo. São as granularidades consideradas por Kimball que mostramos durante a nossa aula. Transacional armazena os registros individuais, tendo as transações como seu grão. Snapshot periódico armazena uma “fotografia”, que contém registros agregados ao fim de um determinado período de tempo. Snapshot acumulado é um tipo de granularidade que permite a atualização de registros, aplicável quando se tem a representação de um processo com etapas intermediárias bem definidas. CERTA
b) O fato de serem componentes de um cubo não impede que os dados estejam armazenados em um banco de dados, seja ele relacional ou multidimensional. ERRADA
c) Podemos deixar a alternativa correta somente trocando a palavra “normalizadas” por “desnormalizadas”. A desnormalização objetiva tornar mais ágeis as consultas analíticas. ERRADA
d) O snowflake diminui o espaço necessário para o armazenamento dos dados em relação ao esquema estrela, já que a normalização realizada elimina dados redundantes. Além disso, a navegação no modelo normalizado se torna mais complexa, devido ao aumento do número de estruturas no modelo e por consequência do maior número de operações de junção entre tabelas que são necessárias para se extrair os dados. ERRADA
e) Os códigos e descrições utilizados como filtros e geralmente como nomes de colunas em relatório são justamente os dados que são armazenados em dimensões. ERRADA
A) CORRETO As tabelas fatos podem ser estruturadas de três forma distintas que representam a forma como queremos armazenar as informações: transacional, snapshot periódico e snapshot acumulado. Essa classificação vai influenciar a escolha da granularidade da tabela fato.
B) ERRADO Os fatos e dimensões são tabelas dos bancos de dados multidimensionais estruturados em uma base relacional.
C) ERRADO No modelo estrela as dimensões não são normalizadas. A normalização aparece nos modelos floco de neve e tem por objetivo reduzir a redundância dos dados e não a melhora do desempenho das consultas.
D) ERRADO Pela justificativa da alternativa anterior, podemos observar que o modelo floco de neve reduz o espeço de armazenamento quando reduz a redundância dos dados.
E) ERRADO Cada dimensão deve conter os atributos descritivos sobre os dados armazenados na tabela fato.
Fonte: https://www.estrategiaconcursos.com.br/blog/gabarito-extraoficial-tcm-ba-analise-de-informacoes-tem-recurso/
Existem três granularidades fundamentais para classificar todas as tabelas fato: transacional, snapshot periódico, ou snapshot acumulado. Cada um dos tipos básicos de tabelas fato estão em:
· transacional: Uma linha na tabela fato transacional corresponde a uma medida de um ponto no espaço e tempo e o grão da transação dessa tabela fato é a mais dimensional e expressiva das tabelas fato;
· snapshot periódico: Uma linha em uma tabela fato snapshot periódico sumariza muitas medidas ocorridas em um período padrão, tal como dia, semana ou mês, ou seja, o grão é o período, não a transação individual;
· snapshot acumulado: Uma linha em uma tabela fato snapshot acumulado sumariza muitas medidas ocorridas entre o início e o fim de um fluxo de trabalho ou processo, ou seja, o grão são as etapas do fluxo.
Modelo Estrela (Star): o esquema estrela é uma estrutura simples, com poucas tabelas e ligações bem definidas, assemelha-se ao modelo de negócio e facilita a leitura e entendimento por todos. O nome estrela está associado à disposição das tabelas de dimensão e de fatos do modelo.
Tabela de fatos é a tabela dominante de um esquema de modelagem tipo estrela (Star Schema), criado pelo Dr. Ralph Kimball, em um modelo multidimensional, e tem como característica principal a presença de dados altamente redundantes (desperdício de espaço) para se obter um melhor desempenho. A tabela de fatos, no "centro" da estrela, fica rodeada por tabelas auxiliares, chamadas de tabelas de dimensão.
Modelo Floco de Neve (Snow Flake): é uma variação do esquema estrela, no qual todas as tabelas de dimensão são normalizadas na segunda forma normal (2FN), ou seja, são retirados das tabelas os campos que são funcionalmente dependentes de outros campos que não são chaves. O Snow Flake reduz o espaço de armazenamento, é mais flexível (facilita evolução das Tabelas Dimensão), mas é mais lento. Recomenda-se utilizar o esquema floco de neve apenas quando a linha de dimensão (número de atributos da tabela) ficar muito longa e começar a ser relevante do ponto de vista de espaço de armazenamento.
Uma vez que os esquemas floco de neve possuem menor redundância do que os esquemas estrela, sua manutenção é mais fácil de ser realizada.
e) Os códigos e as descrições associadas, usadas como nomes de colunas em relatórios e como filtros em consultas, não devem ser gravados em tabelas dimensionais.
ERRADA. Justamente por serem descrições dos atributos, os mesmos devem ser armazenados nas tabelas dimensionais.
Questões de multipla escolha são muito legais kkk eu não sabia se a letra "a" estava errada ou não, mas eu sabia que as outras estavam erradas kkkk
Com relação a banco de dados, julgue o item seguinte.
Diferentemente dos bancos de dados transacionais, a
modelagem de bancos de dados multidimensionais é
caracterizada pelo uso de tabelas fato e tabelas periféricas, que
armazenam, respectivamente, a transação e as dimensões.
Banco de Dados Multidimensionais características:
Utiliza a modelagem para representação de dados :
Tabelas fato
As tabelas Fatos contém as métricas. Possui o caráter quantitativo das informações descritivas armazenadas nas Dimensões. É onde estão armazenadas as ocorrências do negócio e possui relacionamento de “muitos para um” com as tabelas periféricas (Dimensão).
Tabela dimensão
As tabelas dimensão têm uma relação 1:N com a tabela fato e possuem um número significativamente menor de linhas do que as tabelas fato.
possui a Chave Primária (PK)
Caráter QUALITATIVO
Elementos, entidades, que participam de algum fato, o "por" dos dados
Tipo de modelos de dados:
Star-Schema
Snowflake
Certo
Gabarito Certo
Modelo multidimensional é uma técnica de modelagem conceitual de negócios, que facilita a investigação, o resumo e a organização de dados para a análise de negócios. Formado por relações entre dimensões e fatos.
O modelo multidimensional relaciona tabelas de fatos com tabelas de dimensões em um banco de dados do tipo OLAP, possibilitando inúmeras combinações.
Sua modelagem é realizada de forma a ganhar performance nas consultas, possuindo regras diferentes das relacionais em sua modelagem. O modelo multidimensional visa somente consultas analíticas.
"Retroceder Nunca Render-se Jamais !"
Força e Fé !
Fortuna Audaces Sequitur !
Na minha opinião o que não soou bem foi a palavra [transação] na frase, logo que li, a questão pareceu estar errada. Além do mais, continuo sem entender o significado de transação nessa frase.
Diferentemente dos bancos de dados transacionais, a modelagem de bancos de dados multidimensionais é caracterizada pelo uso de tabelas fato e tabelas periféricas, que armazenam, respectivamente, a [transação] e as dimensões.
Existem 6 tipos de fatos:
Fato transacional
Fato agregada
Fato consolidada
Fato snapshot periódico
Fato de snapshot acumulado
Fato sem fato
Fonte: https://rafaelpiton.com.br/data-warehouse-tipos-fatos/
COMPLEMENTANDO: A questão a seguir menciona explicitamente tipos de fatos. http://qconcursos.com/questoes-de-concursos/questao/caed8e2b-3f
Na minha humilde opinião a questão está incorreta.
O termo "transação" é utilizado em bancos de dados OLTP ou transacionais. Quando falamos em banco de dados multidimensional (datawarehouse) utilizamos os termos "fatos" e "dimensões" (correto). As tabelas fato guardam os valores agregados ou seja as métricas (erro da questão no meu ponto de vista, não é "transação") e as dimensões contem informações para realizar as análises multidimensionais (slice, dice, etc)
Certo
A Modelagem de Dados é um instrumento de grande importância, na formatação de estruturas capazes de serem implantadas e compreendidas pelos Sistemas Gerenciadores de Banco de Dados. Constitui a camada fundamental de processos operacionais das empresas.
Fonte: LIMA, Jailson Camargo. Banco de Dados Multidimensional / Jailson Camargo de Lima. FundaçãoEducacional do Município de Assis – FEMA – Assis, 2011. 52 p.
Ótima definição. O modelo dimensional costuma ser representados pelas tabelas fato (que contêm dados das transações) no centro e das dimensões (que contêm os dados qualitativos) estando representadas ao redor.
Comentários do Professor Diego Carvalho - Estratégia Concursos:
Perfeito! Essa modelagem utiliza uma tabela de fatos central e várias tabelas periféricas chamadas de tabelas de dimensão. Eu não gosto do uso do termo “transação” para os dados contidos na tabela de fatos – a questão trata transação como um evento ou acontecimento. Por que, professor? Porque pode confundir com o conceito tradicional de transação em um banco de dados.
Gabarito: Correto
Veja a resolução da questão no vídeo do Professor Vinícius Gnandt: https://youtu.be/p4egQ7PEbdQ
CERTO.
TABELA DE FATO ----> ARMAZENA INFORMAÇÕES QUANTITATIVAS DE ANALISES DOS DADOS.( MEDIDAS, METRICAS).
TABELA DIMENSÃO OU PERIFÉRICA ----> ARMAZENA ATRIBUTOS OU DIMENSÕES DESSES OBJETIVOS CONTIDOS NA TABELA DE FATO.
"VOCÊ É O QUE VOCÊ PENSA, É O SR DO SEU DESTINO."
A QUESTÃO trata-se da operação do OLAP:
Slice and Dice: Permite rotacionar um cubo de modo a visualizar os dados sob diferentes faces, modificando a orientação dimensional do cubo.São operações para realizar navegação por meio dos dados na visualização de um cubo.
Redução do escopo dos dados em análise
Muda a ordem das dimensões
Meu mapa mental: https://uploaddeimagens.com.br/imagens/olap-png
Gabarito A
O Slice and Dice é uma das principais características de uma ferramenta OLAP. Como a ferramenta OLAP recupera o microcubo, surgiu a necessidade de criar um módulo que se convencionou de Slice and Dice para ficar responsável por trabalhar esta informação. Ele serve para modificar a posição de uma informação, alterar linhas por colunas de maneira a facilitar a compreensão dos usuários e girar o cubo sempre que tiver necessidade.
"Retroceder Nunca Render-se Jamais !"
Força e Fé !
Fortuna Audaces Sequitur !
errei tanto que to acertando por osmose...
NUNCA DESISTA!
Slice and Dice: são operações para realizar navegação por meio de dados na visualização de um cubo. É a redução do escopo dos dados em análise.
Alternativa: A
Modelo de dados Multidimensionais:
Modelo Estrela - Star
Consiste em uma tabela de fato com várias tabelas para cada dimensão e propõe uma visão cuja principal característica é a presença de dados redundantes nas tabelas de dimensão.
Floco de Neve - SnowFlake
Resultado da decomposição de uma ou mais DIMENSÕES que possuem hierarquias entre seus membros
Resultado da 3FN sobre as entidades DIMENSÃO. (Machado)
Fonte: meu mapa mental
https://uploaddeimagens.com.br/imagens/modelo_estrela_-_star-png
https://uploaddeimagens.com.br/imagens/floco_de_neve_-_snowflake-png
Gabarito C
- Star Schema - mais popular, mais rápido, só 1 Tabela por Dimensão (menos flexível).
Um dos problemas do Star Schema, é que ele desperdiça espaço,
repetindo as mesmas descrições ao longo de toda a tabela;
- SnowFlake ( Floco de Neve ) - é uma extensão / variação do Star Schema.
Ao contrário do Star Schema, o SnowFlake reduz o espaço de armazenamento.
É mais flexível ( facilita evolução das Tabelas Dimensão ) , mas é mais lento.
Igual ao modelo Estrela, exceto pela Normalização das Tabelas Dimensão(e pela Hierarquia nas mesmas ( poder haver mais de uma) ).
Dificultam as implementações de ferramentas de visualizações de dados.
"Retroceder Nunca Render-se Jamais !"
Força e Fé !
Fortuna Audaces Sequitur !
ou traduz tudo ou não traduz nada.
maluquice falar star scheeme e floco de neve.
Em modelagem multidimensional, o esquema em que as tabelas de dimensão estão ligadas apenas a uma tabela de fatos(várias tabelas dimensões e apenas uma tabela fato), ou seja, todas as dimensões estão sem normas(ou seja desnormalizadas), com todos os níveis em uma só tabela é:
CARACTERÍSTICAS DO MODELO STARSCHEMA:
- DESNORMALIZADA;
- Grande desempenho;
- Poucos Join entre as tabelas dimensões e fato;
- Dados redundantes;
Gabarito letra B;
Starschema = estrela!!! não é normalizado
a) DataMart: pequeno data warehouse, abrange uma área específica. É um depósito de dados especializado, orientado por assunto, integrado, volátiil e variável no tempo;
b) Starschema (Gabarito); ✔
c) Snowflake: um dos esquemas multidimensionais. É uma variação do esquema estrela, em que as tabelas dimensões são organizadas em uma hierarquia ao normalizá-las.
d) TopDown: é um tipo de visão multidimensional que vai do alto nível mais geral, ao nível mais detalhado.
At.te
Foco na missão!!!!
Esquema estrela, ETL e drill down podem, respectivamente, ser definidos como:
O Star schema ou esquema em estrela é uma metodologia de modelagem de dados utilizada do desenho de um Data warehouse.
Os dados são modelados em tabelas dimensionais ligadas a uma tabela de fatos. As tabelas dimensionais contêm as características de um evento. A tabela de fatos armazena os fatos ocorridos e as chave para as características correspondentes, nas tabelas dimensionais.
O nome foi adotado devido a semelhança do modelo como uma estrela. No "centro" da estrela, existe a o que chamou tabela de fatos, rodeada por tabelas auxiliares, chamadas de dimensões. A tabela de fato conecta-se as demais dimensões por múltiplas junções e as tabelas de dimensões conectam-se com apenas uma junção a tabela de fatos.
Desta forma a consulta ocorre inicialmente nas tabelas de dimensão e depois nas tabelas de fatos, assegurando a precisão dos dados por meio de uma estrutura de chaves onde não é preciso percorrer todas as tabelas, garantindo um acesso mais eficiente de com melhor desempenho.
ETL
E - Extract
T - Transform
L-Load
Drill down - termo utilizado para detalhar uma informação dentro de análises OLAP
Drill up - é o inverso, ou seja, partindo de uma informação detalhada a mesma é sumarizada em uma informação mais macro.
GABARITO ITEM E
https://pt.wikipedia.org/wiki/Esquema_estrela
http://intelectivo.com.br/conteudo/10-termos-imprescindiveis-sobre-business-intelligence/
Eu não concordo com a descrição, para o Esquema Estrela, indicado na alternativa E. O Esquema Estrela é empregado como técnica de modelagem multidimensional, e não, propriamente, como um método de otimização.
GABARITO ''E''
O processo ETL consiste na extração (leitura de dados de uma ou mais
bases de dados), transformação (conversão dos dados extraídos de sua forma
anterior para a forma em que precisa estar para que possa ser colocado em um
data warehouse ou simplesmente outro banco de dados), e carga (colocar os
dados no data warehouse)
Drill Down / Up: navegação entre os níveis de dados que vão desde o
mais resumido até o mais detalhado (baixo).
▪ Aqui cabe um parêntese para falar de nível de granularidade.
Nível de granularidade diz respeito ao nível de detalhamento
da informação. Quanto maior o nível de detalhes, menor o nível
de granularidade, pois as informações estão dispostas em
“grãos” menores. Já para menor nível de detalhes, maior a
granularidade, pois os grãos de informações são maiores,
agregando mais os dados.
- o Drill up (Roll up): sobe na hierarquia, agrupando unidades
maiores ao longo de uma dimensão. Aumenta a granularidade.
- o Drill down: fornece uma visão mais detalhada, desagregando
unidades menores ao longo da dimensão. Diminui a granularidade.
Podemos ter: Fatos-aditivos, semi-aditivos e não-aditivos;
.: Fatos-aditivos: São numéricos e podem ser somados em relação às dimensões existentes.
(Fonte: http://www.uniriotec.br/~tanaka/SAIN/03-OLAP&ModelagemDimensional.pdf)
.
.
At.te
Foco na missão ❣
Aditivas: Quando os valores são passíveis de serem somados em todas as dimensões.
Semiaditivas: Quando a soma tiver sentido somente em algumas dimensões, mas não em todas.
Não aditivas: Quando determinado valor não puder ser somado em qualquer dimensão ou sempre produzir um valor sem nenhum sentido válido.
Alternativa: D
Na modelagem dimensional, temos três tipos de fatos: aditivos, semiaditivos e não aditivos. Os aditivos são aqueles que podem ser somados por todas as dimensões. Já os semiaditivos, segundo Kimball, não podem ser somados na dimensão temporal. Os não aditivos, por fim, não podem ser somados entre as dimensões, sendo necessário o estabelecimento de algum tipo de regra específica para fazer sua agregação.
Gabarito E
Modelo multidimensional é uma técnica de modelagem conceitual de negócios, que facilita a investigação, o resumo e a organização de dados para a análise de negócios. Formado por relações entre dimensões e fatos.
O modelo multidimensional relaciona tabelas de fatos com tabelas de dimensões em um banco de dados do tipo OLAP, possibilitando inúmeras combinações.
Sua modelagem é realizada de forma a ganhar performance nas consultas, possuindo regras diferentes das relacionais em sua modelagem. O modelo multidimensional visa somente consultas analíticas.
"Retroceder Nunca Render-se Jamais !"
Força e Fé !
Fortuna Audaces Sequitur !
Comentários:
(a) Errado. Não é nada semelhante a um banco de dados relacionais – usa outro modelo;
(b) Errado. Não é nada semelhante a um banco de dados relacionais – usa outro modelo;
(c) Errado. Pelo contrário, é alimentado por bancos de dados transacionais;
(d) Errado. Na verdade, permite consultas ad-hoc;
(e) Correto. Realmente tem seus dados oriundos de bancos de dados transacionais.
______
Fonte: literalidade do PDF escrito pelos professores: Diego Carvalho, Raphael Henrique Lacerda, Renato da Costa, Thiago Rodrigues Cavalcanti - Informática p/ Polícia Federal (Agente) Pós-Edital - Aula 22, 2021.
a) As chaves estrangeiras são as estruturas que permitem relacionar diferentes tabelas em um SGBD relacional. No caso da modelagem dimensional, a tabela fato é associada às dimensões através dessas estruturas. ERRADA
b) Falso! A modelagem dimensional segue toda uma organização diferente dos bancos de dados relacionais, sendo a principal diferença a questão da normalização/desnormalização. ERRADA
c) Na verdade é o contrário! Os dados dos bancos de dados dimensionais (geralmente os data warehouses ou data marts da organização) são em sua maioria oriundos dos sistemas transacionais da organização, que são os pontos de entrada de dados dentro do negócio. ERRADA
d) A ideia da modelagem dimensional é criar um modelo de simples navegação para que o usuário consiga consultá-lo de diferentes maneiras. Claro que usuários mais leigos podem utilizar programas que facilitem essa análise, que contem somente com algumas possibilidades predefinidas de análise, mas usuários um pouco mais avançados devem poder realizar consultas de forma mais flexível, como aquela possibilitada pelas operações OLAP. ERRADA
e) É a nossa resposta! Como dissemos na letra C, os dados de sistemas transacionais frequentemente servem como fonte de dados no processo de ETL. CERTA
Uma empresa pretende modelar um banco de dados multidimensional para tomada de decisão na área de vendas. O gerente da área quer poder avaliar os dados históricos de vendas, por código ou nome de produto, por mês/ano, por loja e por cidade (há várias lojas em uma mesma cidade; das cidades é registrado apenas o seu nome; é necessário registrar em que cidade está cada loja).
Nesse banco de dados bem projetado, segundo um esquema estrela, haverá
Vamos analisar: o gerente quer poder avaliar os dados históricos de vendas, por código ou nome de produto, por mês/ano, por loja e por cidade. Ele traz outra informação importante: há várias lojas em uma mesma cidade; das cidades é registrado apenas o seu nome; é necessário registrar
em que cidade está cada loja.
Como ele quer avaliar as vendas por produto, mês/ano, loja e cidade, já podemos identificar as dimensões: Produto, Tempo e Loja... Note que é necessário registrar em que cidade está cada loja, portanto cidade é um atributo da tabela loja.
Dúvida aqui: o fato de lugar ser um atributo de loja não tornaria esse desenho Snowflake ao invés de Estrela?
Note que a dimensão produto irá ter seus atributos (nome, descrição, categoria....). Como sempre temos a dimensão temporal, essa possui seus atributos (diário, semanal, mensal....). Agora vem o "pulo do gato" : Se formos criar uma dimensão_loja, se existem várias lojas em uma cidade, como posso identificá-la? Logicamente, com seus atributos! E quais são? Bom, a loja é singularizada por sua localização. Por exemplo : Cacau Show de São Paulo. Pois é essa seu atributo.
Observe que o fato vendas vai ter FK - Código_do_Produto / FK - Período / FK - Loja / Quantidade vendida.
Agora vamos para a informação dada pela questão que a mata : O esquema é estrela, ou seja, não há tabelas dimensão para tabelas dimensão (hierarquizadas). Portanto, se fôssemos criar uma no estilo Floco de Neve, que é normalizada, criaríamos uma outra tabela "Dimensão_cidade" depois referenciaríamos a tabela com uma FK na dimensão_loja.
No caso, a dimensão_loja vai ser : Nome da loja / FK - Localização (PK da tabela dimensão_cidade).
Algum erro, por favor, avisem.
O esquema estrela é um jeito de representar a modelagem dimensional em um SGBD relacional, com o uso de tabelas. Nele, nós representamos os eventos registrados em uma tabela fato, e as características que irão descrever esse evento em tabelas de dimensão. No caso descrito, é fácil perceber que irão existir a tabela fato vendas e suas dimensões produto, tempo e loja.
As cidades são caracterizadas apenas pelo seu nome e servem apenas para identificar o local em que cada loja está localizada. Como na modelagem dimensional organizamos todas as informações associadas a um mesmo conceito em uma mesma tabela, em uma abordagem desnormalizada, o atributo cidade pode ficar dentro da dimensão loja!
Acerca de bases de dados multidimensionais, julgue o item seguinte.
O modelo em estrela de um banco de dados multidimensional
tem como objetivo representar e manipular dados complexos,
visando tornar aqueles dados mais representativos em
semântica e construções de modelagens por meio de nós
e suas ligações.
Alguém saberia explicar?
Gabarito E
O esquema estrela é composto no centro por uma tabela fato, rodeada por tabelas de dimensão, ficando parecido com a forma de uma estrela. A ideia é propor uma visão para modelagem de base de dados para sistemas de apoio à decisão, que é o caso do Data Warehouse.
O Modelo Estrela é um modelo simples, caracterizado por possuir uma única tabela de fatos e chaves simples nas tabelas de dimensões. Nesse modelo cada dimensão é representada por uma única tabela. (Lembra o formato de uma estrela na modelagem)
Os pontos positivos são a eficiência.
Os pontos negativos são o tamanho e a desnormalização das tabelas de dimensões.
A questão está dando o conceito do modelo objeto-relacional.
ERRADO
Meus amores vamos prestar atenção ao enunciado, o Modelo Estrela, POR PADRÃO, não possui nós interligados.
Outros pontos:
1 - A questão não descreve nada do modelo objeto-relacional;
2 - Dados complexos nessa questão pode ser qualquer coisa, inclusive dados NÃO ESTRUTURADOS, que de certa forma são complexos;
3 - Tornar os dados mais representativos em semântica, na minha visão isso está certo, apesar de não ter visto nada explicitando isso em nenhuma literatura. Tendo em vista que o modelo estrela trata de fatos, nos permitindo analisá-los em determinados contextos, temos aí uma questão semântica, pois um mesmo dado em contextos diferentes pode ter peso, função ou utilidade diferentes.
No mais tamo junto!
nessa eu rodei... geralmente cespe cobra diferença entre snow flake e estrela
ou então, diferenças entre fato e dimensões...
nunca tinha visto questao conceitual do estrela
2015
Uma tabela de fatos em um data warehouse armazena os valores detalhados de medidas, ou de valores observados, e as identifica com ligação para tabelas de dimensão.
Certa
2014
O Data Warehouse tem como principal objetivo armazenar dados históricos por meio dos esquemas snow flake ou star schema. O primeiro armazena os dados em dimensões que podem não estar ligadas diretamente à tabela fato; o segundo é voltado para armazenamento de dados não estruturados ou textuais.
errada
2016
Um modelo dimensional é composto por uma tabela com uma chave simples, denominada tabela de fatos, e um conjunto de tabelas maiores, que contém chaves compostas, conhecidas como tabelas de dimensão.
errada
Ano: 2014 Banca: CESPE
Na modelagem multidimensional, é possível haver mais de uma tabela fato no mesmo modelo. A tabela fato expressa a relação N:M (muitos-para-muitos) entre as dimensões, que, por sua vez, implementam a visão e a interface do usuário ao DataWarehouse.
Certa
Meio de nós...estrela só tem um nó.
Pensei assim.
A modelagem DIMENSIONAL possui dois modelos: o modelo estrela (star schema) e o modelo floco de neve (snow flake). Cada um com aplicabilidade diferente a depender da especificidade do problema.
As Dimensões do modelo estrela são desnormalizados, ao contrário do snow flake, que parcialmente possui normalização.
O ESQUEMA ESTRELA É BASICAMENTE UMA TABELA DE FATOS CENTRAL CONECTADA A VÁRIAS TABELAS DE DIMENSÃO EM UM RELACIONAMENTO 1:N, SENDO UMA ÚNICA TABELA PARA CADA DIMENSÃO.
UMA CARACTERÍSTICA IMPORTANTE DESSE MODELO É QUE AS TABELAS DE DIMENSÃO SÃO DESCORMALIZADAS, ISTO É, POSSUEM REDUNDANTES (REDUNDÂNCIA EM BANCOS DE DADOS MULTIDIMENSIONAIS, AJUDA A MELHORAR O DESEMPENHO DE CONSULTAS).
GABARITO: ERRADO
FONTE: Prof. Diego Carvalho.
ESQUEMAS
ESTRELA: menos complexo.
FLOCO DE NEVE: dados mais complexos.
GABARITO ''ERRADO''
Esquema estrela: consiste em uma tabela de fato com várias tabelas para cada dimensão e propõe uma visão cuja principal característica é a presença de dados redundantes nas tabelas de dimensão, mais popular, mais rápido, só uma Tabela por Dimensão (menos flexível). Um dos problemas do Star Schema, é que ele desperdiça espaço, repetindo as mesmas descrições ao longo de toda a tabela. É necessário fazer algumas suposições a respeito do comportamento do usuário no que se refere às consultas realizadas ao sistema. É um modelo simples, caracterizado por possuir uma única tabela de fatos e chaves simples nas tabelas de dimensões. Nesse modelo cada dimensão é representada por uma única tabela. (Lembra o formato de uma estrela na modelagem). Os pontos positivos são a eficiência. Os pontos negativos são o tamanho e a desmoralização das tabelas de dimensões.
- No Modelo Estrela os dados estão desnormalizados, isto é, estão redundantes e replicados, logo não há economia de espaço.
- O Modelo Snowflake acrescenta graus de normalização às tabelas de dimensões, eliminando redundâncias. No entanto, como os dados estão normalizados, as consultas são mais complexas e a obtenção de informações será menos eficientes do que no Modelo Estrela. Esse modelo fornece explicitamente suporte a hierarquias de atributos.
- Modelo Estrela = é basicamente uma Tabela de Fatos central conectada a várias Tabelas de Dimensão em um relacionamento 1:N, sendo uma única tabela para cada dimensão.
- Modelo Snowflake = é basicamente uma Tabela de Fatos central conectada a várias Tabelas de Dimensão, sendo possível haver várias tabelas para cada dimensão.
O comentário do Prof. Ramon Souza, do Exponencial, não relacionou ao SnowFlake e sim ao Modelo Objeto Relacional, conforme abaixo:
Resolução: O modelo objeto relacional tem como objetivo representar e manipular dados complexos, visando tornar aqueles dados mais representativos em semântica e construções de modelagens por meio de nós e suas ligações.
O esquema estrela (star schema) consiste em uma tabela de fatos com uma única tabela para cada dimensão. Neste esquema, existe uma tabela fato central conectada a várias tabelas dimensão.
Acredito que o ''x'' da questão poderia ser obtido pelo conceito de nós e ligações.
Uma tabela fato se liga a várias tabelas dimensões. - Estrela
Uma tabela fato se liga a várias tabelas dimensões que se conectam a outras dimensões (nós). - Snowflake (+ complexo)
Veja a resolução da questão no vídeo do Professor Vinícius Gnandt: https://youtu.be/p4egQ7PEbdQ
Pelo tipo de questão e pelo tempo, já era para ter um comentário de algum professor. Vamos lá QConcursos!
156-CESPE-SLUDF2019) O modelo em estrela de um banco de dados multidimensional tem como objetivo representar e manipular dados complexos, visando tornar aqueles dados mais representativos em semântica e construções de modelagens por meio de nós e suas ligações. ERRADO, NA VERDADE, O SNOW FLAKE É QUE É MAIS COMPLEXO!
@ROTINACONCURSOS
Acho que o erro é que no modelo estrela não tem nó. Típica questãozinha bosta da cespe
O modelo estrela tem como objetivo representar e manipular dados simples, e não complexos!
ERRADO
Estrela
- Tabela Dimensão Desnormalizada
- Rápido tempo de resposta e simplicidade
-Menor nº de tabelas
-Consultas mais simples
Acerca de bases de dados multidimensionais, julgue o item seguinte.
O operador drill-down relaciona-se ao processo de apresentar
dados do nível mais baixo da hierarquia de dados de um
esquema para níveis mais altos.
Gabarito E
Operação de “drill-down” - é o reverso da agregação (“roll-up”), implica em examinar dados com algum nível maior de detalhe;
Pensem da seguinte forma , “drill-down” aumenta a granularidade (nível de detalhe) e "roll-up" diminui a granularidade. É como se você tivesse com uma lupa se aproximando(drill-down) e afastando(roll-up) do "dado".
Errado
A parada é ao contrário, o roll-up que realiza essa operação.
Drill-Down - AFUNDAR NOS DADOS.
Roll-Up - SUBIR na hierarquia dos dados.
2015
A operação roll-up aumenta o nível de agregação dos dados, agrupando-os em unidades maiores ao longo da dimensão, ao passo que a operação drill-down fornece uma visão mais detalhada dos dados.
certa
2013
OLAP é uma tecnologia utilizada para organizar grandes bancos de dados e fornece, para organizações,um método com alta flexibilidade e desempenho para acessar, visualizar e analisar dados corporativos. Os dados podem ser organizados em uma hierarquia que define diferentes níveis de detalhe, na qual o usuário pode navegar para cima (drill up) ou para baixo (drill down) entre níveis.
Certa
Conceito de Drill- Up
Drill Down: ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade (A granularidade determina quais os tipos de consultas podem ser feitas no DW). Ela influencia diretamente na velocidade do acesso às informações e no volume de dados armazenados.
GABARITO: ERRADO
Do mais alto para o mais baixo!
Errado.
Drill Up: de um nível mais detalhado para um genérico (mais baixo para o mais alto)
Drill Down: de um nível mais genérico para um detalhado (mais alto para o mais baixo)
Drill Through: usuário passa a informação contida em uma dimensão para outra
Drill Across: ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão
gabarito: errada
Copiei o exemplo dado pela colega Lopes na questão Q965442
Roll-up: Cidade ➝ Estado ➝ Região ➝ País (maior granularidade, - detalhe)
Drill-down: País ➝ Região ➝ Estado ➝ Cidade (menor granularidade, + detalhe)
Bons estudos e Fé em Deus!
drill-down = detalhamento (do geral para o específico)
Uma dúvida. Banco de dados multidimensionais cai nos concursos policiais? Digo isso pois não vi nada referente ao tema no edital.
ERRADO.
a questão inverteu o conceito, deveria ser ROLL UP.
OPERAÇÃO DRILL DOWN É QUE VAI GERAR UM NIVEL MAIOR DE DETALHAMENTO, JÁ A OPERAÇÃO DRILL UP GERA UM NIVEL MAIOR DE SUMARIZAÇÃO.
DRILL DOWN -------> Permite a navegação entre os níveis de dados que vão desde o mais sumarizado até o
mais detalhado.
ROLL UP OU DRILL UP -----> Permite a navegação entre os níveis de dados que vão desde o mais detalhado até o
mais sumarizado.
'você é o que você pensa, é o sr do seu destino."
ERRADO.
a questão inverteu o conceito, deveria ser ROLL UP.
OPERAÇÃO DRILL DOWN É QUE VAI GERAR UM NIVEL MAIOR DE DETALHAMENTO, JÁ A OPERAÇÃO DRILL UP GERA UM NIVEL MAIOR DE SUMARIZAÇÃO.
DRILL DOWN -------> Permite a navegação entre os níveis de dados que vão desde o mais sumarizado até o
mais detalhado.
ROLL UP OU DRILL UP -----> Permite a navegação entre os níveis de dados que vão desde o mais detalhado até o
mais sumarizado.
'você é o que você pensa, é o sr do seu destino."
dogede> drill down : genérico para detalhado
Essa questão dava para matar com uma noção de inglês. "drill-down": furar para baixo.
tópico desse edital 6 Técnicas de modelagem e otimização de bases de dados multidimensionais
sem previsão no edital da PF
la diz bem claro,
9.4 Banco de dados relacionais: conceitos básicos e características.
tópico desse edital 6 Técnicas de modelagem e otimização de bases de dados multidimensionais
sem previsão no edital da PF
la diz bem claro,
9.4 Banco de dados relacionais: conceitos básicos e características.
Um absurdo, o comentário mais curtido é completamente errado. Com o Drill Down estamos diminuindo o nível da granularidade, aumentando assim o nível de detalhes. Ao contrário disso, o Roll Up aumenta o nível da granularidade, diminuindo dessa forma, o nível de detalhamento das informações.
RESPOSTA E
A operação de DRILL-DOWN/aprofundar refere-se a um movimento no sentido descendente da hierarquia de uma dimensão, desagregando os dados e os apresentando em uma visão mais detalhada.
#questãorespondendoquestões #sefaz-al
A - (E) Não e a principal característica da tabelas fatos, mas sim que ela e o elemento 'central' da linha de infomação
B - (E) O cubo compreende varias dimensões
C - (C)
D - (E) Esse seria um modelo transacional
E - (E)Utilizam se chama ETL
A) Muito forte dizer que é ausente de dados redundantes. É uma premissa e um ponto de reprovação na modelagem de dados multidimensionais, onde é preciso ser revisto a granularidade e outros fatores. Mas, várias instituições públicas ou privadas podem ter cubos com dados redundantes ainda. Não é livre 100%.
Obrigado pelo comentário, Helder Andrade.
Na verdade a hierarquia faz parte do modelo multidimensional, para mudar de hierarquia (orientação) e algo simples feito pela rotação ou giro, já a operação de drill-down realiza uma descida da hierarquia fornecendo uma visão mais detalhada, enquanto a operação de roll-up sobe um nível da hierarquia.
Roll-up: Cidade ➝ Estado ➝ Região ➝ País (maior granularidade, menos detalhe)
Drill-down: País ➝ Região ➝ Estado ➝ Cidade (menor granularidade, mais detalhe)
.
.
At.te
Foco na missão ❣
a) O modelo dimensional tem como característica a desnormalização, algo que ocasiona redundâncias, mas facilita a extração de dados por diminuir a complexidade do modelo e o número de junções necessárias entre tabelas para se realizar as consultas. ERRADA
b) Um cubo de dados possui inúmeras dimensões e registros, não somente uma tupla com seus atributos. ERRADA
c) Essa é a resposta correta. Apesar da redação não ser das melhores, temos que os modelos multidimensionais, expressos nos sitemas OLAP, proporcionam ferramentas para se trabalhar com hierarquias, o que inclui as operações roll-up e drill down, que permitem aumentar ou diminuir o nível de detalhe das consultas analíticas. CERTA
d) Os sistemas que dão ênfase à coleta e a múltiplas transações de dados são os sistemas OLTP, transacionais. ERRADA
e) Os modelos dimensionais utilizam um processo de coleta, transformação e carregamento dos dados conhecido como ETL para a sua alimentação. Essa carga de dados é realizada de forma periódica e vai depender da estratégia cuidadosamente definida pela organização. ERRADA
(a) Errado. Essa é uma premissa da tabela de fatos, mas não sua característica principal;
(b) Errado. Cada cubo é representado por várias tuplas com vários atributos;
(c) Correto. Eles realmente proporcionam visões hierárquicas por meio do roll-up e drill-down;
(d) Errado. Transação de dados são realizadas por modelos transacionais;
(e) Errado. Utiliza, sim, processos de transferência de dados via ETL.
Fonte: Material Estratégia
GABARITO C!
.
.
roll-up -> surface web
drill-drown -> dark web
Eu aprendi que a tabela fatos é justamente redundante.
a - Modelo Relacional é mais complexo
b - O modelo dimensional caracteriza-se por fatos e dimensões.
C – No modelo dimensional, as tabelas “fato” são normalizadas, mas as tabelas “dimensão” são o ponto de entrada e de filtro inicial e podem ser desnormalizadas.
D – Alternativa correta.
E – Modelos dimensionais são de leitura mais fácil por usuários não especializados.
Fonte: BARBIERI, Carlos. Business Intelligence Modelagem e Qualidade. Página 99 - Tabela 5.1
====Letra A====
Os sistemas que gerenciam dados geográficos e aplicações relacionadas são conhecidos como sistemas de informações geográficas.(Certo)
====Letra B====
Sistemas de informações geográficas não são usados em aplicações ambientais de sistema nem em sistemas de transportes e gerenciamento de batalha.(Errado)
Os sistemas que gerenciam dados geográficos e aplicações relacionadas são conhecidos como sistemas de informações geográficas (GIS), e são usadas em áreas como aplicações ambientais, sistemas de transporte, sistema de resposta a emergência e gerenciamento de batalha.
====Letra C====
R-tree é uma árvore com altura desbalanceada, que é uma extensão da estrutura de dados AVL.(Errado)
R-trees: é uma arvore com altura balanceada, que é uma extensão da B-tree para k dimensões onde k>1.
====Letra D====
Tipos de dados como linhas e pontos são usados em bancos espaciais, diferentemente de polígonos e dados de imagem.(Errado)
Um banco de dados espacial é otimizado para armazenar e consultar dados relacionados a objetos no espaço, incluindo pontos, linhas e polígonos. Os tipos de dados para armazenamento de dados espaciais são: Dados de mapa, Dados de atributo, Dados de imagem
A) O famoso GIS
Os sistemas que gerenciam dados geográficos e aplicações relacionadas são conhecidos como sistemas de informações geográficas (GIS — Geographical Information Systems), e são usados em áreas como aplicações ambientais, sistemas de transporte, sistemas de resposta à emergência e gerenciamento de batalha.
Navathe
Bem simples:
a) Drill UP ou Roll UP - Olhar mais de cima, olhar mais de longe, visão em alto nivel, alta granularidade.
Para conhecimento aos colegas:
Drill through - Ver os dados por diferentes pontos de vista, no exemplo: altenar entre dimensão cidade para ano.
Drill Down - Se aprofundar, olhar mais de perto, visão em baixo nível, baixa granularidade.
*Vamos resumir mais, menos copy e paste galera, foco, bons estudos!
Drill Up -> Aumenta o nível de granulidade e diminui o nível da informação.
Drill Down -> Diminui o nível de granulidade e aumenta o nível da informação.
No modelo dimensional, composto por tabelas fato e tabelas dimensão,
A) as tabelas fato não admitem chaves estrangeiras. Tabelas fatos possuem as chaves estrangeiras(FK) e a entrada em uma tabela fato ocorre via tabela dimensão que possui a PK(Chave primaria).
C)Tabela dimensão possui relação 1:N com a tabela fato (Certo)
D) nas tabelas dimensão há apenas atributos numéricos. Errado, atributos númericos por muita das vezes somente encontramos na TABELA FATO, com isso resolvemos a alternativa E)
Quer dizer que uma ou mais tabelas dimensão se relacionam com uma tabela fato?
Acho que inverteram ai
O que a alternativa certa (C) quer dizer é que, na tabela fato, haverá ocorrência de várias vezes a mesma dimensão.
Basta pensar no esquema estrela, onde a tabela fato é a central, e há várias tabelas dimensões, onde a tabela fato usa chaves estrangeiras para identificar a qual dimensão o fato registrado está ligado.
Característica de tabelas Fato:
a) Expressam, em geral, relacionamentos 1:N entre as tabelas dimensão
Também entendi que está invertido
Fonte: Estratégia Concursos
Veja a resolução da questão no vídeo do Professor Vinícius Gnandt: https://youtu.be/p4egQ7PEbdQ
Me corrijam se eu estiver errado, pois não sou de TI.
A letra C quer nos dizer que a Tabela Dimensão pode ser relacionar com 1 ou mais (1:N) tabelas fatos.
A mais correta é o esquema estrela!
As dimensões possuem um relacionamento de “um para muitos” com as tabelas fatos. Ou seja, cada linha da tabela dimensão ligada diretamente a tabela fato pode estar associada a várias linhas da tabela dimensão.
A frase está invertida. Mas a opção C era a menos "errada", banca fraca demais.
** Uma tabela de fatos em um data warehouse armazena os valores detalhados de medidas, ou de valores observados, e as identifica com ligação para tabelas de dimensão.
Essa questão apresenta as principais características das tabelas fato e dimensões. A tabela fato é composta por colunas (chaves estrangeiras) que apontam para as chaves primárias das respectivas dimensões. Além disso, geralmente, possuem outros atributos representando as medidas associada a cada fato registrado. Já as tabelas dimensões que possuem um relacionamento de um para muitos com a tabela fato, ou seja, cada linha da dimensão pode estar associada a várias linhas da tabela fato, e cada linha da tabela fato está associada a apenas uma linha de cada dimensão. As dimensões também apresentam atributos que textuais que descrevem o contexto dos fatos.
Assim, a resposta na alternativa C.
Em um modelo dimensional de dados, definir a granularidade significa definir o
A granularidade afeta diretamente no volume de dados armazenados, na velocidade das consultas e no nível de detalhamento das informações do DW. Quanto maior for o detalhamento, maior será a flexibilidade para se obter respostas. Porém, maior será o volume e menor a velocidade das consultas. Já quanto menor for o detalhamento, menor será o volume, maior a sumarização dos dados e melhor será a performance. Entretanto, menor será a abrangência, ou seja, maior será as restrições das consultas às informações.
Letra A
Bons Estudos!
PF
❌a) A maior diferença entre os dois é que o Data Mart é focado em uma área específica da empresa, sendo considerado um subconjunto do Data Warehouse (esse abrange toda a empresa).
❌b) Um DW é não volátil. Você não pode mais alterar os dados, embora possam ser excluídos.
❌d) Data Warehouse é histórico (variável com o tempo)
❌e)Data Warehouse é orientado por assunto. Ele trata de temas específicos e importantes para o negócio da organização
✅ c) As fontes dos DW são diversas... Pode vir de sistemas legados, ERP, aplicações web e bancos de dados transacionais, etc.
a) Os data marts têm as mesmas características dos data warehouses, só se diferem no escopo. ERRADA
b) A manutenção dos dois tipos de bancos de dados é diferente - alterações e remoções de registros ocorrem com frequência nos sistemas transacionais, mas raramente nos data warehouses, que tendem a ser não voláteis. ERRADA
c) No processo de ETL, os dados coletados podem vir de várias fontes, que podem ser tanto internas quanto externas à organização. CERTA
d) Os DW são variantes no tempo, não atemporais. Eles mantêm um histórico de informações para permitir a análise de como os dados se comportaram ao longo do tempo. ERRADA
e) O DW é direcionado a assunto, não a aplicações. Os bancos de dados mais voltados para aplicações e que seguem os processos de negócio organizacionais são os transacionais, que utilizam o modelo relacional. ERRADA
Um BD multidimensional pode estar estruturado em um modelo chamado estrela, no qual há uma tabela principal e várias tabelas periféricas.
A modelagem dimensional possui dois modelos: o modelo estrela (star schema) e o modelo floco de neve (snow flake).
Modelo estrela realmente é uma tabela principal com várias tabelas periféricas ligado diretamente a ele. Uma tabela fato, com várias tabelas tabelas dimensões ligada a ele
Resumo: só tem uma tabela fato
Modelo floco de neve é uma tabela principal com tabelas fatos e tabelas dimensões ligadas a ele
Resumo: Tem mais de uma tabela fato
(que vontade de desenhar isso rsrs)
#PCDF aí vamos nós
STAR SCHEMA (Esquema estrela):
- Abordagem que não recomenda a normalização das tabelas dimensão.
- Mais recomendável e tem maior desempenho;
- É a estrutura básica de um modelo de dados multidimensional.
- Possui uma grande entidade central denominada fato.
- Possui relacionamento 1:N (uma para muitos) o sentido da dimensão para o fato.
SNOWFLAKE SCHEMA (Esquema de flocos de neve):
- Abordagem que recomenda a normalização das tabelas dimensão.
- Possui dimensões normalizadas;
- É mais lento devido a normalização.
- É o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros.
-É o resultado da terceira forma normal sobre as entidades dimensão
Uma consulta em um banco de dados multidimensional normalmente é mais lenta do que em um BD relacional.
Entenda o banco de dados multidimensional como um armazém de dados, um Date Werahouse por exemplo, e o banco de dados relacional como aquele banco de dados de sistemas OLTP (Online Transaction Processing) como uma caixa, aqueles sistemas de vendas da loja por exemplo.
Dados essas dois conceitos, onde seria mais demorado procurar por uma determinada informação, numa caixa que contém uma menor quantidade de dados ou em um armazém que contém várias caixas?
GABARITO: CERTO
Não concordo com o gabarito. Em um OLAP, os dados são sintetizados para dar a agilidade que os BDs relacionais não conseguiriam. Será que ninguém entrou com recurso? A banca deveria revelar a literatura da qual retirou essa questão.
Veja o que Date diz:
"Fechamos esta seção observando que alguns produtos combinam as abordagens de ROLAP e MOLAP; HOLAP (“OLAP híbrido”). Existe uma controvérsia considerável sobre qual das três abordagens é “melhor”, e pouco se pode fazer aqui para ajudar a resolver essa controvérsia.** Porém, de modo geral, os produtos MOLAP oferecem computação mais rápida, mas admitem quantidades de dados menores que os produtos ROLAP (tornando-se menos eficientes à medida que a quantidade de dados aumenta), enquanto os produtos ROLAP oferecem recursos de escalabilidade, concorrência e gerenciamento mais amadurecidos que os de produtos MOLAP."
Fonte: Introdução a Sistemas de Banco de Dados, capítulo 21 - Apoio à decisão.
"Sua modelagem é realizada de forma a ganhar performance nas consultas, possuindo regras diferentes das relacionais em sua modelagem. O modelo multidimensional visa somente consultas analíticas."
Fonte: https://pt.wikipedia.org/wiki/Modelo_multidimensional
"While we’ve been discussing financial data warehouses in the context of relational databases, it is worth noting that multidimensional OLAP vendors have long played a role in this arena. OLAP products have been used extensively for financial reporting, budgeting, and consolidation applications. We often see relational dimensional models feeding financial OLAP data cubes. OLAP cubes are precalculated, which results in fast query performance that is critical for executive use. The data volumes, especially for the G/L balances or financial statement aggregates, typically do not overwhelm the practical size constraints of a multidimensional product. OLAP is well suited to handle complicated organizational roll-ups, as well as complex calculations, including interrow manipulations. Most multidimensional OLAP vendors provide finance-specific capabilities, such as financial functions (for example, net present value or compound growth), the appropriate handling of financial statement data (in the expected sequential order, such as income before expenses), and the proper treatment of debits and credits depending on the account type, as well as more advanced functions such as financial
consolidation."
Fonte: Data Warehouse Toolkit - Ralph Kimboll, página 185.
Não entendi... BD multidimensional é desnormalizado, ou seja, tem alta redundância. Se há mais redundância que um modelo relacional, então não deveria ser mais rápida ??
Ta errado
Os bancos de dados multidimensionais é que tendem a ser mais rápidos, devido à redundância. Quanto mais normalizados (como é o caso dos relacionais), mais lentos. Os multidimensionais também podem ser normalizados, mas o comum é serem altamente redundantes. Dados replicados facilitam no momento de gerar relatórios.
FUI PELA LÓGICA DE QUE SERIA MAIS FÁCIL E PRÁTICO UMA NAVEGAÇÃO EM BANCO DE DADOS RELACIONAL, SENDO ASSIM, MAIS RÁPIDA A NAVEGAÇÃO. AGORA O MULTIMENSIONAL, POR APRESENTAR MAIS FUNCIONALIDADES, SE TORNA MAIS LENTO QUANDO COMPARADO AO RELACIONAL.
ESSE GABARITO PROVAVELMENTE ESTEJA ERRADO, OU FALTOU RECURSO À ÉPOCA.
BANCOS MULTIDIMENSIONAIS SÃO MELHORES QUE OS RELACIONAIS PARA CONSULTA; AO PASSO QUE, PARA CARREGAMENTO DOS DADOS, O RELACIONAL É MELHOR.
A BANCA NÃO FOI PRECIOSISTA NA DIFERENÇA DOS TERMOS.
CERTO
Porém eu discordo veemente dessa questão, pois Quanto mais dados eu tenho, mais rápido é a forma de eu chegar até determinada informação, cito, por exemplo, a Tabela Estrela e a Tabela Flocos de Neve, a primeira tem um desempenho muito maior por ser Desnormalizada, ao passo que a Segunda possui um desempenho menor por estar normalizada até a 3FN. Logo, a normalização desgasta o desempenho do BD, pois o SGBD terá que fazer um trabalho muito mais longo até encontrar o dado desejado.
Para o cespe, isso está errado. Vide questão Q1680469
O bom que a Cespe ora entende que é mais rápido, ora entende que é mais lento.
Um banco de dados multidimensional apresenta uma estrutura de dados multidimensional, como uma matriz de n dimensões.
Pegadinha maldosa dessa questão!!!
a parte inicial do texto ta ok. O problema está em dizer que é como uma matriz de n dimensões
deveria ser, por exemplo: como uma tabela fato de n dimensões
Gabarito: ERRADO
Uma das técnicas usadas para o tratamento de dados multidimensionais em um BD é o MOLAP.
MOLAP = Recupera dados de um banco de dados multidimensional; alto desempenho; recomendado para data mart; baixa escalabilidade
MOLAP - multidimensional
ROLAP - relacional
O OLAP possui um conjunto de técnicas para o tratamento dos dados contidos na visão multidimensional do Data Warehouse.
As ferramentas OLAP podem ser de diferentes tipos: MOLAP, ROLAP ou HOLAP.
O OLAP multidimensional (MOLAP) é o tipo de ferramenta que utiliza estrutura de banco de dados multidimensional.
Gabarito: C
#PF
No modelo relacional de bancos de dados, os elementos ficam armazenados em tabelas bidimensionais simples, contendo linhas (registros) e colunas (campos), e os elementos de um arquivo do banco podem relacionar-se com diversos elementos de outros arquivos.
Certo
Modelagem dimensional é normalmente utilizada para modelar um Data Warehouse. Uma das técnicas utilizadas para se obter um modelo para o data warehouse que identifique e represente as informações importantes para o modelo de negócios é a modelagem dimensional ou multidimensional. Quando bem definido, o modelo dimensional pode ser uma ajuda de valor incalculável para as áreas de negócio, apoiando e otimizando todo o processo de tomada de decisões.
https://www.devmedia.com.br/artigo-sql-magazine-13-modelagem-de-data-warehouses-e-data-marts-parte-1/5656
O HOLAP faz o tratamento de bancos híbridos, aqueles que têm parte relacional e parte multidimensional.
O OLAP possui um conjunto de técnicas para o tratamento dos dados contidos na visão multidimensional do Data Warehouse.
As ferramentas OLAP podem ser de diferentes tipos: MOLAP, ROLAP ou HOLAP.
O OLAP multidimensional (MOLAP) é o tipo de ferramenta que utiliza estrutura de banco de dados multidimensional.
O IBGE está implantando novas ferramentas para auxiliar na tomada de decisão em diferentes níveis hierárquicos. Dessa forma, os analistas estão em dúvida da utilização do esquema estrela ou cubos OLAP em um Data Warehouse. Sabendo disso, analise as assertivas e assinale a alternativa que aponta a(s) correta(s).
I. Quando os dados são carregados em um cubo OLAP, eles são armazenados e indexados usando formatos e técnicas projetadas para dados dimensionais.
II. Uma das vantagens do esquema estrela é o suporte a hierarquias irregulares complexas e de profundidade indeterminada, como organogramas ou listas de materiais.
III. O modelo dimensional, quando implementado em banco de dados multidimensional, é chamado de esquema em estrela.
"(...) o suporte a hierarquias irregulares complexas e de profundidade indeterminada (...)"
Traz na memória o desenho do snowflake, não do estrela.
Modelos dimensionais implementados em um banco de dados multidimensional são referidos como cubo OLAP.
O qconcurso pra TI e contabilidade é uma vergonha.
II - O esquema estrela é uma estrutura simples, com poucas tabelas e ligações. Logo não é complexo
III - Existem dois tipos de modelos dimensionais (estrela e floco de neves) por isso a afirma III está errada.
Os modelos multidimensionais tiram proveito dos relacionamentos inerentes aos dados para preencher os dados em matrizes multidimensionais, chamadas cubos de dados. Em relação a este tipo de modelagem, assinale a alternativa correta.
Letra C
Para resolver essa questão vc deve entender que o MODELO MULTIDIMENSIONAL possui ALTA-REDUNDÂNCIA, ou seja, grande replicação de dados.
A REDUDANCIA ajuda a melhorar muito o desempenho no processo de consultas e análises.
Já no modelo relacional é trabalhado com baixa-redundância.
STAR SCHEMA (Esquema estrela)
- Abordagem que não recomenda a normalização das tabelas dimensão.
- Mais recomendável e tem maior desempenho;
- É a estrutura básica de um modelo de dados multidimensional.
- Possui uma grande entidade central denominada fato.
- Possui relacionamento 1:N (uma para muitos) o sentido da dimensão para o fato.
SNOWFLAKE SCHEMA (Esquema de flocos de neve)
- Abordagem que recomenda a normalização das tabelas dimensão.
- Possui dimensões normalizadas;
- É mais lento devido a normalização.
- É o resultado da decomposição de uma ou mais dimensões que possuem hierarquias entre seus membros.
Alternativa: C
Analise as afirmativas abaixo com relação à modelagem dimensional.
Transcrição correta
46. Analise as afirmativas abaixo com relação à modelagem dimensional.
1. A tabela de dimensões é a principal tabela de um modelo dimensional, onde as medições numéricas de interesse da empresa estão armazenadas.
2. A tabela fatos registra os fatos que serão analisados. É composta por uma chave primária (formada por uma combinação única de valores de chaves de dimensão) e pelas métricas de interesse para o negócio.
3. Uma tabela de dimensão contém o nome específico de cada membro da dimensão. O nome membro da dimensão é denominado Atributo.
4. A qualidade do banco de dados é proporcional à qualidade dos atributos de dimensões. Portanto, devem ser dedicados tempo e atenção à sua descrição, ao seu preenchimento e à garantia da qualidade dos valores em uma coluna de atributos.
A única alternativa errada é a 1, que descreve a tabela fatos, e não dimensão
Formata essa p*rra ai QC!
No que se refere a conceitos de modelagem de dados relacional e dimensional, julgue o item a seguir.
Na modelagem dimensional, a tabela fatos armazena as
dimensões e os detalhes dos valores descritivos do armazém
de dados.
O erro da questão está em afirmar que a tabela fato armazena a dimensão, quando na verdade ela armazena as chaves para as dimensões.
Gab. Errado
Modelagem dimensional é normalmente utilizada para modelar um Data Warehouse.
Data Warehouse - Voltado para empresas para melhor tomada de decisões estratégicas - Armazena dados estruturados - Tabelas, e-mail, documentos e arquivos
Data Lake - É projetado para armazenar dados de diversas fontes e formatos, não havendo a necessidade da definição de um esquema de dados para inserir novos itens - Armazena dados estruturados ou não estruturados - Tabelas, documentos, vídeos, arquivos, imagens.
Data Mart - Voltado por assunto, área ou algo mais especifico
Os dados normalizados estão na terceira forma normal, utilizada em banco de dados relacional. Esse estilo de banco tem como foco inserir, alterar e deletar os dados.
Já os desnormalizados têm foco na consulta, na entrega de informações.
Com a modelagem dimensional não temos a garantia de consistências dos dados, além de termos um banco muito maior.
Existem dois tipos de metodologias de modelagem de dados usadas no Data Warehouse, a Snowflake e a Star Schema, que é a mais utilizada.
No Star Schema os dados são modelados em tabelas dimensionais, ligadas a uma fato. A tabela fato está sempre ligada a duas ou mais dimensões, não existe tabela fato com menos de duas dimensões.
A tabela fato armazena o que ocorreu.
Essa tabela armazena 2 coisas:
- Os fatos ocorridos, ou seja, as métricas
- As chaves para as dimensões
A tabela dimensão contêm as características de um evento.
As dimensões armazenam 3 coisas:
- A Surrogate Key
- A Natural Key
- Os atributos
Fontes: https://rafaelpiton.com.br/blog/data-warehouse-modelagem-dimensional/
Gabarito: ERRADO
A tabela dimensão contêm as características de um evento. Por exemplo, quando eu faço uma venda, quero saber por onde a venda foi feita, que produto foi vendido, ou para quem.
Já a tabela fato armazena o que ocorreu, é o fato propriamente dito, por isso ela tem esse nome, porque é o fato ocorrido. A tabela fato está sempre ligada a duas ou mais dimensões, não existe tabela fato com menos de duas dimensões.
GABARITO ERRADO!
O modelo dimensional envolve dois tipos de relações (tabelas):
Tabela de Dimensão: Armazena atributos nos quais uma dimensão se decompõe.
Ex. Dimensão Produto: Número, Nome, Descrição, Estilo, Linha...
Tabela de Fatos: Armazena os fatos registrados em tuplas. Cada fato possui atributos e seus valores são ponteiros / referências para tabelas de dimensão.
Ex. Produto1 vendido em 10/10/2018 em Mosoró por R$10.000.000.000,00.
ELMASRI, Ramez; NAVATHE, Shamkant. Database systems. Boston, MA: Pearson Education, 2011.
Gabarito: Errado.
As tabelas fato armazenam as chaves para as dimensões. Em uma tabela fato há valores detalhados de medidas. E para cada dimensão representada na tabela fato, haverá uma tabela dimensão com maior detalhamento dessa dimensão.
Geralmente a tabela fato é recheada de chaves estrangeiras, cada uma é referente a uma chave primária de uma tabela dimensão.
CARACTERÍSTICAS DE TABELAS FATO
Armazenam ocorrências, eventos ou fatos de um processo de negócio da organização.
Possuem geralmente uma grande quantidade armazenada de registros ou tuplas.
São normalizadas e sem hierarquia (decomposições em outras tabelas).
São tabelas que geralmente crescem verticalmente: mais registros ou linhas.
Armazenam medidas/métricas quantitativas (valores ou indicadores).
Podem ser medidas de desempenho, métricas operacionais, medidas agregadas, etc.
Contêm chaves estrangeiras que correspondem às chaves primárias das Tabelas Dimensão.
Apresentam uma chave primária composta em que a dimensão tempo sempre é parte integrante.
Expressam, em geral, relacionamentos de 1:N entre as Tabelas Periféricas (Dimensão).
CARACTERÍSTICAS DE TABELAS DIMENSÃO
Armazenam atributos ou dimensões que descrevem medidas de uma Tabela Fato;
Possuem geralmente menos linhas e mais colunas que Tabelas Fato;
São desnormalizadas e com hierarquia (decomposições em outras tabelas).
Possuem uma chave primária que identificam unicamente seus registros;
As chaves primárias das Tabelas Dimensão compõem a chave primária da Tabela Fato;
São tabelas que geralmente crescem horizontalmente: mais atributos ou colunas;
Apresentam atributos qualitativos ou textuais (Ex: Nome, Sexo, Data de Nascimento);
Permitem a visualização de fatos por meio de diversas perspectivas diferentes;
Atributos devem ser verbosos, descritivos, completos, discretos e corretos;
Respondem à pergunta: "Quando?", "O que?", "Onde?" e "Quem?";
Exemplos: Pessoas, Produtos, Lugares, Tempo, entre outros.
No trecho que diz "e os detalhes dos valores descritivos...", a questão está afirmando que os atributos que descrevem os fatos são armazenados na tabela de fatos. Isso está incorreto, pois essa é a função das dimensões. As tabelas fato ou tabelas de fatos armazenam somente as chaves estrangeiras para as dimensões e os fatos ou métricas. Os atributos descritivos compõem as dimensões e podem ser associados aos fatos pelos relacionamentos entre a respectiva dimensão e a tabela de fatos.
Modelagem dimensional é uma técnica de projeto lógico normalmente usada para data warehouses que contrasta com a modelagem entidade-relacionamento. Segundo o prof. Kimball, a modelagem dimensional é a única técnica viável para bancos de dados que devem responder consultas em um data warehouse.
A foi definida sobre dois pilares:
Dimensões conformados diz respeito a entidade que servem de perspectivas de análise em qualquer assunto da organização. Uma dimensão conformada possui atributos conflitantes com um ou mais data-marts do data warehouse.
Por grão de fato entende-se a unidade de medida de um indicador de desempenho. Assim, quando fala-se de unidades vendidas, pode-se estar falando em unidades vendidas de uma loja em um mês ou de um dado produto no semestre. Obviamente, esse valores não são operáveis entre si.
A modelagem multidimensional visa construir um data warehouse com dimensões conformados e fatos afins com grãos os mais próximos possíveis.
Esse tipo de modelagem tem dois modelos MODELO ESTRELA () e MODELO FLOCO DE NEVE (SNOW FLAKE).
A tabela de fatos mantém identificadores para as vårias dimensöes e valores numéricos. As linhas contém o nivel mais excelente de detalhe disponivel através do armazenamento. Cada dimensäo possui uma tabela de dimensäo associada que mantém todos seus dados.
Fonte:
[1] Web Semântica Para Retardados, Pollock, Jeffrey
Para quem está boiando nessa matéria e vai fazer a PF:
https://www.youtube.com/watch?v=7Hys-OagYx0
Pessoal,
Melhor do que eu ficar enchendo linguiça aqui, aconselho vcs a dar um google imagens e ver como é a tabela de fatos. Vai ficar mais fácil entender as futuras questões sobre esse assunto.
PF só cai modelagem relacional, não cai tem previsão de modelagem dimensional. Logo se cair uma dessa será anulada!
Na modelagem dimensional, a tabela fatos armazena (as dimensões e os detalhes dos valores descritivos do armazém de dados - erro).
Tabelas:
Fato: Armazena o fato.
Dimensão: armazena a característica, a dimensão do fato.
Tabela de Fato → armazena info. QUANTITATIVAS p/ análise dos dados.
x
Tabela de Dimensão → armazena atributos/dimensões que EXPLICAM OS FATOS (objetos) contidos na tabela de fato.
9.4 Banco de dados relacionais: conceitos básicos e características.