Questão Q591493

Question

Em relação a Big Data e NoSQL, é correto afirmar que

Answer

a) os 3 Vs são Volume, Velocidade e Variedade

b) não faz sentido

c) Hadoop é um projeto Apache

d) NoSQL é um sistema não relacional (No SQL/ Sem SQL)

e) alternativa correta

espero ter ajudado

Answer

NoSQL representa varios bancos que nao sao relacionais mas usam outras formas de organização, tendo como caracteristicas como alto desempenho, escalabilidade, rep´licação, suporte a dados estruturados e subcolunas, sendo tb muito tolerantes a erros. NoSQL trabalha com o conceito de big data tendo como exemplos Berkeley DB, MemcacheDB, Cassandra (Apache), MongoDB & Vertica

Answer

Os “3 Vs" principais do Big Data referem-se a Volume, Velocidade e Variedade.

Answer

Questão ANAC ESAF 2016 (Q623459):

Big Data é: d) volume + variedade + velocidade + veracidade, tudo agregando + valor.

Apache Cassandra é um projeto de sistema de banco de dados distribuído altamente escalável de segunda geração, que reúne a arquitetura do DynamoDB, da Amazon Web Services e modelo de dados baseado no BigTable, do Google.

O Cassandra inicialmente foi criado pelo Facebook, que abriu seu código-fonte para a comunidade em 2008. Agora é mantido por desenvolvedores da fundação Apache e colaboradores de muitas empresas.

https://pt.wikipedia.org/wiki/Apache_Cassandra

Gabarito: e)

Answer

Existem 4 modelos de dados NoSQL, baseados em documentos, chave-valor, colunar ou família de colunas e baseados em grafos. O Cassandra usa o modelo colunar.

A alternativa E fala que os dados do Cassandra são identificados por uma chave, o que me gerou dúvidas.

Alguém sabe esclarecer?

Answer

Gabarito E

O Cassandra foi inicialmente desenvolvido pelo Facebook para ser utilizado no motor de busca de sua caixa de entrada de mensagens. Em 2008 ele se tornou open-source e em 2009 passou a ser mantido pela Apache Foundation. Seu modelo de distribuição do sistema é baseado no Dynamo (desenvolvido pela Amazon) enquanto a forma de organização dos dados é baseado no BigTable (desenvolvido pelo Google).

O Dynamo nasceu a partir da necessidade de se ter um banco de dados simples, altamente escalável e confiável para lidar com grandes demandas de leitura/escrita. Essa motivação veio de uma série de momentos de indisponibilidade do site da Amazon durante a Black-Friday de 2004 nos Estados Unidos causados em boa parte por sobrecargas nos bancos relacionais utilizados na época, resultando em prejuízo financeiro para o site de e-commerce. O Dynamo então foi desenvolvido e empregado para tratar os sistemas que sofriam com maior demanda como o de carrinho de compras e sessões de usuário. Em 2007, a Amazon disponibilizou um documento descrevendo como a arquitetura do Dynamo funcionava, esse documento serviu de base para a criação de vários outros bancos NoSQL.

O BigTable também começou a ser desenvolvido em 2004 pelo Google, também como uma solução altamente escalável e distribuída. O desafio nesse caso era armazenar o volume imenso de dados de indexação de todas as páginas web mapeadas pelo Google que então era utilizado para alimentar o seu motor de buscas.

A distribuição oficial do Cassandra é compatível com todas as distribuições do Linux e com o Mac OS. Existe também uma versão compatível com o Windows distribuída pela DataStax. O Cassandra é, por concepção, feito para trabalhar de forma distribuída, sendo que não há grandes vantagens em trabalhar com ele utilizando apenas uma máquina. Ao utilizar várias máquinas (também chamadas de nós), vemos o verdadeiro potencial da solução.

"Retroceder Nunca Render-se Jamais !"
Força e Fé !
Fortuna Audaces Sequitur !

Answer

Gabarito: E

O cassandra é um banco de dados NoSQL do tipo Wide Column Store que é um hibrido entre um banco NoSQL do tipo "key-value" e um sistema de banco de dados baseado em tabelas.

"Cassandra is wide column store, and, as such, essentially a hybrid between a key-value and a tabular database management system. Its data model is a partitioned row store with tunable consistency."

Fonte: https://en.wikipedia.org/wiki/Apache_Cassandra

Em 2001 eram 3Vs, de: Volume, Velocidade e variedade

Autores atuais dizem que na verdade são 5 Vs : Volume, Variedade, Velocidade, Veracidade e geração de Valor

Answer

Conceito dos 3Vs:·

Volume: como determinar a relevância entre grandes volumes de dados e como criar valor a partir dessa relevância

Velocidade: velocidade significa o quão rápido os dados estão sendo produzidos e o quão rápido devem ser tratados para atender as demandas. Reagir rápido o suficiente para lidar com a velocidade é um desafio para a maioria das organizações.

Variedade: os dados de hoje vêm em todos os tipos de formatos, seja bancos de dados tradicionais, hierarquias de dados, arquivo texto, e-mail, vídeo, áudio e etc.

Existe outro conceito, dos 4Vs:

Veracidade: representa a falta de confiabilidade inerente em algumas fontes de dados.

Visibilidade: é a relevância dos dados. A organização está ciente de todos os dados que ele gera? Estes poderiam ser, aparentemente, registros de dados inconsequentes. Em outras palavras tentamos entender se todos os dados gerados estão disponíveis, e se são de fato armazenados e ficam visíveis para os analistas de dados.

Valor: as informações geradas devem produzir algum valor para as organizações.

Variabilidade (e complexidade): Variabilidade refere-se à variação nas taxas de fluxo de dados. Muitas as vezes, a velocidade de Big Data não é consistente e tem picos e depressões periódicas. Complexidade refere-se ao fato de Big Data gerar ou receber informações através de uma multiplicidade de fontes. Isso impõe um desafio crucial a necessidade de se conectar, integrar, limpar e transformar os dados recebidos de diferentes fontes.

Answer

GAB. E

Minhas considerações:

Em relação a alternativa C -> Hadoop NAO É banco de dados. É base de dados flexível e escalável.

Em relação a alternativa D -> NoSQL não usa modelo relacional. Armazena-se por meio de documentos, chave-valor ou grafos.

Algum erro? me notifiquem. Bons estudos.

Answer

Em relação a Big Data e NoSQL, é correto afirmar que

A) os “3 Vs" principais do Big Data referem-se a Volume, Velocidade e Versatilidade (Variedade) de dados.

B) na era do Big Data, as únicas estratégias eficientes para garantir a privacidade são consentimento individual, opção de exclusão e anonimização.

C) o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi criado pela IBM (Apache), a partir de sua ferramenta de Data Mining WEKA.

D) o NoSQL é um sistema não relacional, distribuído, em larga escala, muito eficaz na organização e análise de grande quantidade de dados.

E) o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL, originalmente criado pelo Facebook, no qual os dados são identificados por meio de uma chave.

Answer

a) Hoje em dia o Big Data são 5Vs: Volume, Velocidade, Variedade, Veracidade e Valor. Porém, o maior erro da alternativa é incluir a Versatilidade.

b) há diversas alternativas para gerar privacidade, inclusive há uma lei específica que trata desse assunto, a Lei Geral de Proteção de Dados (13.709/2018).

c) Hadoop foi criado pelo projeto Apache, e não pela IBM.

d) O NoSQL é um termo genérico para banco de dados não relacionais. Não significa sem SQL, na verdade ele inclui o SQL e outras, NoSQL é Not Only SQL (não somente SQL).

Perseverança!

Answer

Gabarito: Letra E.

Em síntese vc precisa saber disso:

Cassandra é um banco NoSQL do tipo chave-valor

Answer

Seguuura na mão de Deeeeeus...e vai.

SóProvas

Continue usando...

O que está incluso