SóProvas


ID
1774486
Banca
ESAF
Órgão
ESAF
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Em relação a Big Data e NoSQL, é correto afirmar que

Alternativas
Comentários
  • a) os 3 Vs são Volume, Velocidade e Variedade

    b) não faz sentido

    c) Hadoop é um projeto Apache

    d) NoSQL é um sistema não relacional (No SQL/ Sem SQL)

    e) alternativa correta

    espero ter ajudado

  • NoSQL representa varios bancos que nao sao relacionais mas usam outras formas de organização, tendo como caracteristicas como alto desempenho, escalabilidade, rep´licação, suporte a dados estruturados e subcolunas, sendo tb muito tolerantes a erros. NoSQL trabalha com o conceito de big data tendo como exemplos Berkeley DB, MemcacheDB, Cassandra (Apache), MongoDB & Vertica

  • Os “3 Vs" principais do Big Data referem-se a Volume, Velocidade e Variedade.

  • Questão ANAC ESAF 2016 (Q623459):

    Big Data é: d) volume + variedade + velocidade + veracidade, tudo agregando + valor.

     

    Apache Cassandra é um projeto de sistema de banco de dados distribuído altamente escalável de segunda geração, que reúne a arquitetura do DynamoDB, da Amazon Web Services e modelo de dados baseado no BigTable, do Google.

    O Cassandra inicialmente foi criado pelo Facebook, que abriu seu código-fonte para a comunidade em 2008. Agora é mantido por desenvolvedores da fundação Apache e colaboradores de muitas empresas.

    https://pt.wikipedia.org/wiki/Apache_Cassandra

     

    Gabarito: e)

  • Existem 4 modelos de dados NoSQL, baseados em documentos, chave-valor, colunar ou família de colunas e baseados em grafos. O Cassandra usa o modelo colunar.

    A alternativa E fala que os dados do Cassandra são identificados por uma chave, o que me gerou dúvidas.

    Alguém sabe esclarecer?

  • Gabarito E

    Cassandra foi inicialmente desenvolvido pelo Facebook para ser utilizado no motor de busca de sua caixa de entrada de mensagens. Em 2008 ele se tornou open-source e em 2009 passou a ser mantido pela Apache Foundation. Seu modelo de distribuição do sistema é baseado no Dynamo (desenvolvido pela Amazon) enquanto a forma de organização dos dados é baseado no BigTable (desenvolvido pelo Google).

    O Dynamo nasceu a partir da necessidade de se ter um banco de dados simples, altamente escalável e confiável para lidar com grandes demandas de leitura/escrita. Essa motivação veio de uma série de momentos de indisponibilidade do site da Amazon durante a Black-Friday de 2004 nos Estados Unidos causados em boa parte por sobrecargas nos bancos relacionais utilizados na época, resultando em prejuízo financeiro para o site de e-commerce. O Dynamo então foi desenvolvido e empregado para tratar os sistemas que sofriam com maior demanda como o de carrinho de compras e sessões de usuário. Em 2007, a Amazon disponibilizou um documento descrevendo como a arquitetura do Dynamo funcionava, esse documento serviu de base para a criação de vários outros bancos NoSQL.

    O BigTable também começou a ser desenvolvido em 2004 pelo Google, também como uma solução altamente escalável e distribuída. O desafio nesse caso era armazenar o volume imenso de dados de indexação de todas as páginas web mapeadas pelo Google que então era utilizado para alimentar o seu motor de buscas.

    A distribuição oficial do Cassandra é compatível com todas as distribuições do Linux e com o Mac OS. Existe também uma versão compatível com o Windows distribuída pela DataStax. O Cassandra é, por concepção, feito para trabalhar de forma distribuída, sendo que não há grandes vantagens em trabalhar com ele utilizando apenas uma máquina. Ao utilizar várias máquinas (também chamadas de nós), vemos o verdadeiro potencial da solução.

     

     

    "Retroceder Nunca Render-se Jamais !"
    Força e Fé !
    Fortuna Audaces Sequitur !

  • Gabarito: E

    O cassandra é um banco de dados NoSQL do tipo Wide Column Store que é um hibrido entre um banco NoSQL do tipo  "key-value" e um sistema de banco de dados baseado em tabelas.

    "Cassandra is wide column store, and, as such, essentially a hybrid between a key-value and a tabular database management system. Its data model is a partitioned row store with tunable consistency."

    Fonte: https://en.wikipedia.org/wiki/Apache_Cassandra

     

    Em 2001 eram  3Vs, de: Volume, Velocidade e variedade

    Autores atuais dizem que na verdade são 5 Vs : Volume,  Variedade, Velocidade, Veracidade e geração de Valor

     

     

     

  • Conceito dos 3Vs:·       

    Volume: como determinar a relevância entre grandes volumes de dados e como criar valor a partir dessa relevância

    Velocidade: velocidade significa o quão rápido os dados estão sendo produzidos e o quão rápido devem ser tratados para atender as demandas. Reagir rápido o suficiente para lidar com a velocidade é um desafio para a maioria das organizações.

    Variedade: os dados de hoje vêm em todos os tipos de formatos, seja bancos de dados tradicionais, hierarquias de dados, arquivo texto, e-mail, vídeo, áudio e etc.

    Existe outro conceito, dos 4Vs:

    Veracidade: representa a falta de confiabilidade inerente em algumas fontes de dados.

    Visibilidade: é a relevância dos dados. A organização está ciente de todos os dados que ele gera? Estes poderiam ser, aparentemente, registros de dados inconsequentes. Em outras palavras tentamos entender se todos os dados gerados estão disponíveis, e se são de fato armazenados e ficam visíveis para os analistas de dados.

    Valor: as informações geradas devem produzir algum valor para as organizações.

    Variabilidade (e complexidade): Variabilidade refere-se à variação nas taxas de fluxo de dados. Muitas as vezes, a velocidade de Big Data não é consistente e tem picos e depressões periódicas. Complexidade refere-se ao fato de Big Data gerar ou receber informações através de uma multiplicidade de fontes. Isso impõe um desafio crucial a necessidade de se conectar, integrar, limpar e transformar os dados recebidos de diferentes fontes.

  • GAB. E

    Minhas considerações:

    Em relação a alternativa C -> Hadoop NAO É banco de dados. É base de dados flexível e escalável.

    Em relação a alternativa D -> NoSQL não usa modelo relacional. Armazena-se por meio de documentos, chave-valor ou grafos.

    Algum erro? me notifiquem. Bons estudos.

  • Em relação a Big Data e NoSQL, é correto afirmar que

    A) os “3 Vs" principais do Big Data referem-se a Volume, Velocidade e Versatilidade (Variedade) de dados.

    B) na era do Big Data, as únicas estratégias eficientes para garantir a privacidade são consentimento individual, opção de exclusão e anonimização.

    C) o Hadoop, o mais conhecido e popular sistema para gestão de Big Data, foi criado pela IBM (Apache), a partir de sua ferramenta de Data Mining WEKA.

    D) o NoSQL é um sistema não relacional, distribuído, em larga escala, muito eficaz na organização e análise de grande quantidade de dados.

    E) o Cassandra é um sistema de banco de dados baseado na abordagem NoSQL, originalmente criado pelo Facebook, no qual os dados são identificados por meio de uma chave.

  • a) Hoje em dia o Big Data são 5Vs: Volume, Velocidade, Variedade, Veracidade e Valor. Porém, o maior erro da alternativa é incluir a Versatilidade.

    b) diversas alternativas para gerar privacidade, inclusive há uma lei específica que trata desse assunto, a Lei Geral de Proteção de Dados (13.709/2018).

    c) Hadoop foi criado pelo projeto Apache, e não pela IBM.

    d) O NoSQL é um termo genérico para banco de dados não relacionais. Não significa sem SQL, na verdade ele inclui o SQL e outras, NoSQL é Not Only SQL (não somente SQL). 

    Perseverança!

  • Gabarito: Letra E.

    Em síntese vc precisa saber disso:

     Cassandra é um banco NoSQL do tipo chave-valor

  • Seguuura na mão de Deeeeeus...e vai.