-
O QUE É O HADOOP ?
Hadoop é uma estrutura de software open-source para armazenar dados e executar aplicações em clusters de hardwares comuns. Ele fornece armazenamento massivo para qualquer tipo de dado, grande poder de processamento e a capacidade de lidar quase ilimitadamente com tarefas e trabalhos ocorrendo ao mesmo tempo.
Fonte: sas.com/pt_br/insights/big-data/hadoop.html
#Terei orgulho em pertencer!
-
fiquei na dúvida....
Por que o Hadoop não pode ser um bando de dados se ele armazena, processa e opera os dados?
-
Gabarito: A.
O Hadoop é uma coleção de subprojetos relacionados para computação distribuída, sendo todos eles hospedados pela Apache. Por possuir o código aberto, ele permite modificações relacionadas às necessidades de cada um, tal como é visto em larga escala com as distribuições Linux.
Bons estudos!
-
"Hadoop é um sistema de armazenamento compartilhado, distribuído e altamente confiável para processamento de grandes volumes de dados através de clusters de computadores. Em outras palavras, Hadoop é um framework que facilita o funcionamento de diversos computadores, com o objetivo de analisar grandes volumes de dados"
Fonte: Patrícia Quintão
-
(a) Correto, ele realmente é um sistema de armazenamento e processamento, sendo
massivamente escalável sem ser um banco de dados;
(b) Errado, isso seria Big Data Analytics;
(c) Errado, ele não é um banco de dados;
(d) Errado, ele é um software e, não, um hardware;
(e) Errado, ele não é um banco de dados.
-
"O Hadoop é um projeto da comunidade Apache (//hadoop.apache.org), foi criado pelo Yahoo em 2005, inspirado no trabalho do Google em seu GFS (Google File System) e no paradigma de programação MapReduce, que basicamente divide o trabalho em tarefas como um mapeador (mapper) e um resumidor (reducer) que manipulam dados distribuídos em um cluster de servidores usados de forma massivamente paralela."
Fonte: Cezar Taurion
-
GAB: A
Hadoop é uma plataforma de software em Java de computação distribuída voltada para clusters e processamento de grandes volumes de dados, com atenção a tolerância a falhas.
-
Gab. : letra A
Hadoop é um sistema de armazenamento compartilhado, distribuído e altamente confiável para processamento de grandes volumes de dados (estruturados ou não) através de clusters de computadores.
Em outras palavras, Hadoop é um framework que facilita o funcionamento de diversos computadores, com o objetivo de analisar grandes volumes de dados.
Ele é composto por 3 modelos principais:
- H. MapReduce (cobrado na prova da PF/18);
- H.Yarn
- H. Distribuited File system (HDFS)