-
pode ser considerado "qualquer" dado/dado heterogêneo:
-
Variedade: o Big Data deve ser capaz de lidar com diferentes formatos de informação, como, por exemplo, arquivos de texto, e-mail, medidores e sensores de coleta de dados, vídeo, áudio, dados de ações do mercado ou transações financeiras. Dados são gerados em inúmeros formatos — desde estruturados (numéricos, em databases tradicionais) a não estruturados (documentos de texto, e-mail, vídeo, áudio, cotações da bolsa e transações financeiras, etc.)
Fonte: Patrícia Quintão
-
(a) Correto, essa é definição perfeita de variedade no contexto de Big Data;
(b) Errado, trata-se de um banco de dados heterogêneo, que trata de informações de tipos diferentes e sem um padrão de segurança;
(c) Errado, essa definição se refere à velocidade;
(d) Errado, essa definição não apresenta nenhuma relação com o conceito de variedade;
(e) Errado, o conceito de variedade trata de dados em quaisquer formatos.
Gabarito: Letra A
Fonte: estratégia
-
Big Data - Variedade
- Dados: estruturados, semiestruturados e não estruturados.
## Variedade é heterogêneo (diferentes formatos)
-
BIG DATA
É definido como coleções de dados cuja sua quantidade é tão grande que é difícil armazenar, gerenciar, processar e analisar esses dados por meio de bancos de dados tradicionais.
[...]
☛ Os dados possuem "5V's":
Volume -> Grande quantidade.
Variedade -> São variados.
Velocidade -> São criados de uma forma extremamente rápida.
Valor -> Devem possuir valor, ou seja, deve agregar conhecimento.
Veracidade -> Devem ser verídicos, verdadeiros.
[...]
Velocidade
➥ Está relacionada com o fato dos dados em big data ocorrem em fluxo contínuo. É o que acontece com as postagens nas redes sociais.
[...]
Volume
➥ Está relacionado com a quantidade de espaço que é necessário para armazenar dados de big data. Geralmente, esses dados não irão caber, por exemplo, no seu computador de casa.
[...]
Variedade
➥ Está ligada ao fato dos dados possuírem diferentes naturezas. O big data não tem preconceito. Todo tipo dado é bem vindo. Seja ele estruturado ou não estruturado.
[...]
Variabilidade
➥ É a oscilação nos níveis dos dados colhidos e trabalhados. Como essas informações vêm de múltiplas fontes, dizemos que o nível é variável.
[...]
Viscosidade
➥ Tem relação com a dificuldade de navegar entre os dados. Essa dificuldade pode ser considerar como uma espécie de inércia. Como os dados são variados, o algoritmo tem que ser capaz de lidar com diferentes fontes, essa flexibilidade tem um custo. Um deles é a viscosidade.
[...]
Volatilidade
➥ Diz respeito às inconsistências nos dados ou à mudança de dimensões entre eles, já que vêm de vários tipos origens.
[...]
(CESPE – Papiloscopista da PF 2018)
De maneira geral, big data não se refere apenas aos dados, mas também às soluções tecnológicas criadas para lidar com dados em volume, variedade e velocidade significativos. (CERTO)
.
(CESPE – Agente de Polícia Federal 2018)
Big data refere-se a uma nova geração de tecnologias e arquiteturas projetadas para processar volumes muito grandes e com grande variedade de dados, permitindo alta velocidade de captura, descoberta e análise. (CERTO)
[...]
RESUMO
☑ Grande banco de dados.
☑ Engloba todos os tipos de dados.
☑ Dados estruturados ou não estruturados.
☑ Para melhor proveito, usa-se Data Mining e Data Warehouse.
___________
Fontes: Techtudo; Questões da CESPE; Colegas do QC.
-
Variedade: o Big Data deve ser capaz de lidar com diferentes formatos de informação, como, por exemplo, arquivos de texto, e-mail, medidores e sensores de coleta de dados, vídeo, áudio, dados de ações do mercado ou transações financeiras. Dados são gerados em inúmeros formatos — desde estruturados (numéricos, em databases tradicionais) a não estruturados (documentos de texto, e-mail, vídeo, áudio, cotações da bolsa e transações financeiras, etc.)
Fonte: Patrícia Quintão
Big Data
É definido como coleções de dados cuja sua quantidade é tão grande que é difícil armazenar, gerenciar, processar e analisar esses dados por meio de bancos de dados tradicionais.
[...]
☛ Os dados possuem "5V's":
Volume -> Grande quantidade.
Variedade -> São variados.
Velocidade -> São criados de uma forma extremamente rápida.
Valor -> Devem possuir valor, ou seja, deve agregar conhecimento.
Veracidade -> Devem ser verídicos, verdadeiros.