O PRINCIPAL OBJETIVO DA INGESTÃO DE DADOS É: absorver dados de uma variedade de fontes e transferi-los para um local de destino onde podem ser depositados e analisados. De modo geral, os destinos podem ser um banco de dados, data warehouse, armazenamento de documentos, data mart, etc. Por outro lado, existem várias opções de origem, como planilhas, extração de dados da web ou web scrapping, aplicativos internos e SaaS dados.
- QUESTÃO MUITO BOA, A INGESTÃO DE DADOS TAMBÉM PODE, APESAR DE NÃO SER O PRINCIPAL OBJETIVO:
- ingestão de dados em tempo real
A ingestão de dados em tempo real, também conhecida como dados de streaming, é útil quando os dados coletados são extremamente sensíveis ao tempo. Os dados são extraídos, processados e armazenados assim que são gerados para a tomada de decisões em tempo real. Por exemplo, os dados adquiridos de uma rede elétrica devem ser supervisionados continuamente para garantir a disponibilidade de energia.
- Ingestão de dados em lote
Quando a ingestão ocorre em lotes, os dados são movidos em intervalos agendados de forma recorrente. Essa abordagem é benéfica para processos repetíveis. Por exemplo, relatórios que precisam ser gerados todos os dias.
A arquitetura lambda equilibra as vantagens dos dois métodos mencionados acima, utilizando o processamento em lote para oferecer amplas visualizações dos dados em lote. Além disso, ele usa processamento em tempo real para fornecer visualizações de informações urgentes.
Alguém conseguiu achar o erro?
"O principal objetivo da ingestão de dados é organizar, armazenar e recuperar dados em tabelas relacionadas a entidades do mundo real."
Me parece estranho esse relacionamento entre tabelas e entidades do mundo real. Penso que as tabelas representam entidades do mundo real, conforme uma outra questão da CESPE:
"A modelagem de dados cria estruturas abstratas de dados para representar entidades do mundo real. Os quatro passos necessários para executar essa modelagem são:"