Questão Q933198

Julgue o item seguinte, a respeito de big data e tecnologias relacionadas a esse conceito.

MapReduce oferece um modelo de programação com processamento por meio de uma combinação entre chaves e valores.

Alternativas

Certo

Errado

Comentários

(...) muitas tarefas de análise de dados necessitam combinar dados “espalhados” em discos diferentes. Entretanto, esses problemas não geram dores de cabeça aos programadores, pois o MapReduce oferece um modelo de programação que os abstrai, uma vez que o processamento é realizado através de uma combinação entre chaves e valores (keys e values) que podem estar em diferentes discos.

https://www.devmedia.com.br/hadoop-mapreduce-introducao-a-big-data/30034
GAB: CERTO

Como o próprio nome revela, o MapReduce é baseado nas funções Map() e Reduce().

Sua operação se divide em duas etapas:
Na primeira fase, chamada de Map (mapeamento), os dados são separados em pares de chave e valor, divididos em fragmentos (cestos) e distribuídos para os nodes (pessoas), onde serão processados (contadas).

Depois disso, pode ocorrer outras fases, por exemplo, Shuffle.

Essa fase agrupa os dados intermediários pela chave e produz um conjunto de tuplas (k2, list(v2)).
Assim todos os valores associados a uma determinada chave serão agrupados em uma lista.

Após essa fase intermediária, o arcabouço também se encarrega de dividir e replicar os conjuntos de tuplas para as tarefas Reduce que serão executadas
Item correto. Na fase referente à função map, os dados são mapeados em pares chave-valor. Após a fase intermediária de rearranjo (shuffling), eles são então reduzidos novamente para gerar uma saída única.
MapReduce é um método de programação para a execução de processamento paralelo em grandes quantidades de dados, cuja base é relativamente simples, apesar de constituir um recurso poderoso. Com um conjunto de itens a processar, o algoritmo MapReduce corresponde às seguintes etapas:
a)       utilizar uma função map para transformar cada item em zero ou mais pares chave-valor;
b)       juntar todos os pares com chaves idênticas;
c)       usar uma função reduce em cada conjunto de valores agrupados para produzir valores de saída para a chave correspondente.
gabarito: correto

MapReduce: modelo de PROGRAMAÇÃO que permite reduzir problemas grandes em problemas menores, mapeando
cada subproblema para máquinas diferentes.

PROGRAMAÇÃO + PROCESSAMENTO

Rodoop: uma das implementações do MapReduce. É um software de código aberto, um sistema de armazenamento e processamento de dados massivamente escalável, NÃO É UM BANCO DE DADOS.

ARMAZENAMENTO + PROCESSAMENTO
Assertiva c
MapReduce oferece um modelo de programação com processamento por meio de uma combinação entre chaves e valores.
O Hadoop MapReduce é um modelo de programação e um arcabouço especializado no processamento de conjuntos de dados distribuídos em um aglomerado computacional (cluster).
O MapReduce funciona da seguinte forma:
1. A entrada da aplicação é uma lista de pares chave/valor.
2. Então, esses pares são selecionados um a um e processados, cada um gerando um par (chave/lista) de valores. Os detalhes dessa transformação é que normalmente definem o que o programa MapReduce faz.
3. Essa nova lista de pares é selecionada como entrada pela função Reducer e é agregada de alguma forma, gerando uma saída final.

Gabarito: Certo.

Prof. Ramon Souza
CERTO

O MapReduce é considerado um modelo de programação que permite o processamento de dados massivos em um algoritmo paralelo e distribuído.
Prezados,

A estrutura MapReduce opera exclusivamente em pares <chave, valor>, ou seja, a estrutura vê a entrada para a tarefa como um conjunto de pares <chave, valor> e produz um conjunto de pares <chave, valor> como a saída do trabalho.

Portanto a questão está correta.

Fonte:
Disponível no site do Haddop.apache.

Gabarito do Professor: CERTO.
Hadoop/Map Reduce (Mapeia e reduz)
O MapReduce é um modelo de programação que permite reduzir problemas grandes em problemas menores, mapeando cada subproblema para máquinas diferentes (ou processadores diferentes de uma mesma máquina) e, em seguida, reduzindo cada resposta intermediária à única resposta final que você está procurando.
É considerado um modelo de programação que permite o processamento de dados massivos em um algoritmo paralelo e distribuído (em clusters). A etapa de mapeamento se baseia em uma combinação de chave-valor.

O mapeamento é como se fosse a busca, a palavra-chave. Como se fosse o filtro do Q concursos;
Já a etapa de redução é responsável por consolidar os resultados de cada mapeamento, gerando um resultado agregado. Como se fosse as questões quando aparecem para você;
Isso mesmo. O MapReduce trabalha com agrupamento por chave-valor.
Resposta: Certo
Na fase referente à função map, os dados são mapeados em pares chave-valor. Após a fase intermediária de rearranjo (shuffling), eles são então reduzidos novamente para gerar uma saída única.

Fonte: Arthur Mendonça | Direção Concursos
Cada entrada no Map cria uma lista de pares chave/valor. Esses pares são selecionados um a um e processados, cada um gerando um par (chave/lista) de valores. Certo

Hachid Targino
Sobre o MapReduce: "É o paradigma de programação que possibilita escalabilidade massivamente paralela em centenas ou milhares de servidores. O próprio termo MapReduce representa duas tarefas distintas que os programas Hadoop executam. A primeira tarefa é mapear os dados, ou seja, acessar um conjunto de dados e convertê-los em outro conjunto onde os elementos individuais são quebrados em tuplas (pares chave/valor). A tarefa Reduce pega o resultado do mapeamento e combina estas tuplas em um conjunto menor de tuplas, obtendo o resultado."

Fonte: Cezar Taurion
Gab: Certo

Resuminho:

Hadoop é um projeto que oferece uma solução para problemas relacionados à BigData; seu núcleo é constituído de duas partes essenciais:

1º) Hadoop Distributed Filesystem (HDFS) - sistema de arquivos distribuído e confiável, responsável pelo armazenamento dos dados (arquivos muito grandes), o qual é realizado através de uma combinação chave e valor.

2º) Hadoop MapReduce - responsável pela análise e processamento dos dados através de um modelo de programação em um algoritmo paralelo e distribuído, geralmente em um cluster de computadores. O modelo de programação é formado por duas operações básicas:

map (Processo de Mapeamento) - os dados são separados em pares, transformados e filtrados; depois são distribuídos para os nodes (nós) e processados.

reduce (Processo de Redução) - os dados são agregados em conjuntos menores e os dados resultantes do processo são transformados em um formato padrão chave-valor.

Ou seja, questão correta! O MapReduce oferece um modelo de programação com processamento por meio de uma combinação entre chaves e valores.

Foco, força e fé! Desistir, jamais!
No cerne do MapReduce estão duas funções: Map e Reduce. Eles são sequenciados um após o outro.
- A função Map obtém a entrada do disco como pares <chave, valor>, os processa e produz outro conjunto de pares <chave, valor> intermediários como saída.
- A função Reduce também aceita entradas como pares <chave, valor> e produz pares <chave, valor> como saída.
[1] https://www.talend.com/resources/what-is-mapreduce/ (traduzido).
CERTO
MapReduce (Hadoop)

- É um modelo de programação que permite o processamento de dados massivos em um algoritmo paralelo e distribuído, geralmente em clusters (conjunto de servidores)
- Possui grande poder de armazenamento e processamento de todos os tipos de dados
- Possui software open-source (código aberto)
- É usado no Big Data, pois possui escalabilidade, durabilidade e disponibilidade
- Custo é baixo: estrutura gratuita

SóProvas

Continue usando...

O que está incluso