-
Data Lake é um repositório de armazenamento e engine para processamento de Big Data. Fornece armazenamento massivo para qualquer tipo de dado, enorme poder de processamento e capacidade de lidar com tarefas simultâneas, praticamente ilimitadas, além de possibilitar a criação de correlações e obtenção de insights para apoiar a tomada de decisão mais eficiente.
Esta arquitetura possibilita manter um grande repositório de dados “brutos”, preservando o princípio de imutabilidade, garantindo . Além disso, os cientistas de dados podem acessar e analisar dados com mais rapidez e precisão, e os analistas podem acessá-los para uma variedade de casos de uso, como análise de sentimento ou detecção de fraudes.
O segredo do Data Lake é o conceito de metadado (dado sobre dado). Cada dado inserido no Data Lake possui um metadado que o identifica e facilita sua localização e posterior análise.
Fonte:
-
Um "data lake" ou na tradução :" lago de dados" é um sistema ou repositório de dados armazenados em seu formato natural / bruto, geralmente objetos blobs (objetos de imagem, áudio ou outro objetos multimedia) ou arquivos.
-
(a) Errado, os dados não precisam estar relacionados e, portanto, não é orientado por assunto;
(b) Errado, não é um conjunto de dados relacionais e não precisa haver relacionamentos entre tabelas de diferentes esquemas – os dados são de diversos formatos e de diversas fontes;
(c) Errado, não é o resultado de operações de mineração de dados – são dados brutos sem tratamento e da maneira que foram capturados;
(d) Correto, ele realmente é projetado para armazenar dados de diversas fontes e formatos, não havendo a necessidade da definição de um esquema de dados para inserir novos itens
Fonte: estratégia concursos - pdf
-
O Data Lake é um grande repositório capaz de armazenar dados estruturados, semi-estruturados e não-estruturados, assim como um método para organizar grandes volumes de dados de diversos formatos e de diversas fontes diferentes.
Fonte: Estratégia
-
A LETRA A SE REFERE AOS DATA MARTS.
NAVATHE: Os data marts geralmente têm como alvo um subconjunto da organização, como um departamento, e têm o foco muito mais estreito.
-
d-
A data lake is a system or repository of data stored in its natural/raw format, usually object blobs or files. ... A data lake can be established "on premises" (within an organization's data centers) or "in the cloud" (using cloud services from vendors such as Amazon, Microsoft, or Google).
https://en.wikipedia.org/wiki/Data_lake