SóProvas


ID
2626846
Banca
CESPE / CEBRASPE
Órgão
ABIN
Ano
2018
Provas
Disciplina
Arquitetura de Computadores
Assuntos

A respeito de datacenter, julgue o próximo item.


A deduplicação tem como objetivo remover duplicidade no becape dos dados, podendo ser executada na origem, no próprio ambiente de produção, ou no destino, o servidor de becape.

Alternativas
Comentários
  • Gabarito Certo

    Deduplicação vem do termo em ingles deduplication que é o processo de analisar identificar e remover duplicidade nos dados, diminuindo assim a quantidade de informação a ser manipulada e armazenada.

    A deduplicação surgiu para tirar algum benefício do fato que existirem arquivos parecidos, como réplicas e arquivos com diferentes versões. Em uma réplica, o software de deduplicação pode apenas gravar um dos arquivos e criar links para os demais. Em arquivos de diferentes versões, os pedaços de arquivos comuns são gravados apenas uma vez, sendo criados links nos demais arquivos.

    A ideia é fazer com que no sistema de arquivos nunca exista um cluster contendo os mesmos dados. Com isso, ganha-se espaço em disco e diminuição no tempo de backup.

    Por exemplo:


    Você cria um arquivo em excel, manda para o departamento administrativo, automaticamente o colaborador vai salvar numa pasta compartilhada na rede, logo você terá dois arquivos com as mesmas informações. Agora imagine este cenário em um ambiente com diversos colaboradores, criando, copiando e salvando arquivos iguais ou parecidos. Isso com certeza gera um grande volume de dados duplicados. Quando aplicada a deduplicação ela automaticamente irá comparar os dados serem gravados em disco com os já existentes e criar apontamentos para o arquivo principal, ou seja não salvará arquivos duplicados.

     

     

    "Retroceder Nunca Render-se Jamais !"
    Força e Fé !
    Fortuna Audaces Sequitur !


  • Deduplicação in-line
    A Deduplicação in-line elimina os dados redundantes durante o processo de backup, antes mesmo de serem gravados. O processo in-line geralmente é mais demorado visto que os dados serão armazenados somente após a deduplicação dos mesmos.

    Deduplicação pós-processamento
     Na deduplicação pós processamento o backup completo é realizado normalmente e a analise e remoção das redundâncias nos dados são efetuadas em um processo posterior separadamente do backup. Isso garante um backup mais rápido porém necessita de mais espaço de armazenamento.

    Deduplicação de Origem:remove os dados redundantes em ambiente de produção

    Deduplicação de Destino:remoção dos dados redundantes são feitos após o seu envio pela rede

  • Deduplicação de Origem A deduplicação na origem remove os dados redundantes em ambiente de produção, antes mesmo de serem enviados para o servidor de backup.

    Deduplicação In-line (ambiente de produção) A Deduplicação in-line elimina os dados redundantes durante o processo de backup, antes mesmo de serem gravados. O processo in-line geralmente é mais demorado visto que os dados serão armazenados somente após a deduplicação dos mesmos.

    Deduplicação de Destino Na deduplicação de destino o processamento e remoção dos dados redundantes são feitos após o seu envio pela rede, ou seja, direto no appliance ou servidor de backup.

    Deduplicação Pós-Processamento (No Servidor de becape) Na deduplicação pós processamento o backup completo é realizado normalmente e a analise e remoção das redundâncias nos dados são efetuadas em um processo posterior separadamente do backup. Isso garante um backup mais rápido porém necessita de mais espaço de armazenamento.

  • Essa comparação do Ibsen é muito superficial. [1] define deduplicação como processo de analisar dados no nível do subarquivo(e não no nível de arquivo, como ele fez) e armazenar apenas os elementos que ainda não foram armazenados na mídia. 

    Igual o Ibsen fez no seu comentário, [1] afirma que algumas definições de desduplicação só fazem essa comparação no nível do arquivo, como um único documento do Word que foi armazenado individualmente em vários locais - todos com backup. No entanto, isso não é desduplicação, mas na verdade é um processo conhecido como instância única de armazenamento ou SIS(Single instance storage). 

    Quando a desduplicação verdadeira é utilizada, novos dados são lidos, divididos em blocos, comparados com os blocos que já estão armazenados e apenas os novos blocos são armazenados. Os blocos que já existem são criados como ponteiros para os dados já armazenados. Isso reduz os dados armazenando apenas os blocos uma vez para cada passagem subsequente de dados.  Essa redução de dados é medida, não em termos da quantidade de dados armazenados, mas como uma proporção dos dados processados ​​para os dados armazenados (denominada taxa de deduplicação).

    Fonte:

    [1] Pro Data Backup and Recovery, Steven Nelson.

  • Deduplication Types and Terms Now that deduplication as a concept has been explained, how is it implemented? Deduplication is simply software, either preinstalled on hardware to provide an appliance type solution, or integrated as part of a backup solution. The deduplication software can be implemented in two different ways: • Source-based: Performs the deduplication function on the backup client and then sends the resulting data stream to the backup target. • Target-based: Performs the deduplication function after the backup client has sent the backup stream to the server writing the backup media. Both types of deduplication have advantages and limitations, depending on the data types being protected. In the target-based model, deduplication is performed in two different processing models: • Inline: The deduplication is performed as the data is being received and is stored immediately in a deduplicated format.

    : The data stream to be deduplicated is stored in an intermediate storage area, or landing zone, and is then deduplicated as a scheduled process after the data has been fully stored.

  • GABARITO CORRETO!

    .

    .

    Segundo Manoel Veras (2009, p.254), "A deduplicação de dados é uma nova tecnologia para gerenciar o crescimento de dados e fornecer proteção de dados. Para eliminar dados redundantes do storage, essa técnica de backup salva uma única cópia de dados idênticos e substitui todas as outras por indicadores que apontam para essa cópia."

  • |Essa questão é uma aula !