SóProvas


ID
2646214
Banca
CESPE / CEBRASPE
Órgão
TCM-BA
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de big data, assinale a opção correta.

Alternativas
Comentários
  • Analisando as alternativas

     

     a) A utilização de big data nas organizações não é capaz de transformar os seus processos de gestão e cultura.

    Errada. Muito pelo contrário.

     

     

    b) Sistemas de recomendação são métodos baseados em computação distribuída, que proveem uma interface para programação de clusters, a fim de recomendar os tipos certos de dados e processar grandes volumes de dados.

    Errada

    Portal das tecnologias de informação

    Um Sistema de Recomendação combina várias técnicas computacionais para selecionar itens personalizados com base nos interesses dos usuários e conforme o contexto no qual estão inseridos.[1] Tais itens podem assumir formas bem variadas como, por exemplo, livros, filmes, notícias, música, vídeos, anúncios, links patrocinados, páginas de internet, produtos de uma loja virtual, etc.

    https://pt.wikipedia.org/wiki/Sistema_de_recomenda%C3%A7%C3%A3o

     

     

    d) As ações inerentes ao processo de preparação de dados incluem detecção de anomalias, deduplicação, desambiguação de entradas e mineração de dados.

    Errada. 

     

     

    e) O termo big data se baseia em cinco Vs: velocidade, virtuosidade, volume, vantagem e valor.

    Errada.

    5 Vs do Big Data

    Volume

    Velocidadee

    Variedade

    Veracidade

    Valor

     

    https://www.gta.ufrj.br/grad/15_1/bigdata/vs.html

  • Sobre a D

     

    A mineração de dados é posterior à preparação deles, não sendo aquela parte desta.

  • Scrapers (no bom português "raspadores")

     

    -São softwares (na verdade é uma técnica, os softwares utilizam essa técnica) que visam retirar grande volumes de dados de sites da internet

    -Os dados coletados serão armazenados em um banco de dados para análise posterior

    -Apesar da infinidade de interesses que uma empresa pode ter em aplicar a técnica, ela também pode ser utilizado para condutas duvidosas como o roubo de dados e o plágio

     

    GABARITO: C

  • Big Data pode ser definido, de maneira mais simplista, como um conjunto de técnicas capazes de se analisar grandes quantidades de dados para a geração de resultados importantes que, em volumes menores, dificilmente seria possível.

    Em tese, podemos definir o conceito de Big Data como um conjunto de dados extremamente amplos que, por isto, necessitam de ferramentas especiais para comportar o grande volume de dados que são encontrados, extraídos, organizados, transformados em informações que possibilitam uma análise ampla e em tempo hábil.

  • a) A utilização de técnicas relacionadas a big data dinamiza a gestão, provendo meios mais eficientes para a tomada de decisão baseada em grandes conjuntos de dados variados, e é capaz de alterar a cultura corporativa através de ferramentas de modernização. ERRADA

    b) Um sistema de recomendação, na verdade, é um sistema que visa apresentar para o usuário alguma sugestão baseada em seus interesses pessoais. Por exemplo, a Netflix sugere um filme baseado nos programas que você geralmente assiste, ou então uma empresa de publicidade exibe anúncios direcionados aos produtos que você geralmente compra. Ao contrário do que afirma a questão, os sistemas de recomendação não proveem uma interface para programação de clusters. Eles podem funcionar sim de forma distribuída, mas esse não é um requisito desse tipo de sistema. ERRADA

    c) Essa é a nossa resposta. Os scrapers ou raspadores são sistemas que, uma vez programados, coletam dados automaticamente da internet e dão uma certa estrutura a esses dados, facilitando sua manipulação e análise. CERTA

    d) A detecção de anomalias e tarefas como deduplicação – eliminação de registro duplicados, e desambiguação – conversão de diferentes formas de representação da mesma informação em uma só, são sim etapas desse processo de pré-processamento. Contudo, temos que a mineração de dados é uma etapa posterior ao pré-processamento, tornado a alternativa errada. ERRADA

    e) O termo big data é normalmente associado a 3 Vs: volume, velocidade e variedade. Contudo, posteriormente convencionou-se adicionar mais dois Vs: valor e veracidade. Dessa maneira, temos que virtuosidade e vantagem não fazem parte desse conjunto de características. ERRADA

  • Big Data tem sido revolucionário em muitas organizações. Big Data tem modificado processos de gestão e cultura (LETRA - A) de diversas organizações por meio da descoberta de novas informações para tomadas de decisão estratégicas. Trata-se de um enorme conjunto de dados que utiliza softwares especiais para o processamento e transformação de dados em informações com precisão em uma velocidade absurdamente alta. Refere-se a uma nova geração de tecnologias e arquiteturas projetadas para processar volumes muito grandes e com grande variedade de dados, permitindo alta velocidade de captura, descoberta e análise.

    Pode-se recorrer a software conhecidos como scrapers para coletar automaticamente e visualizar dados que se encontram disponíveis em sítios de navegabilidade ruim ou em bancos de dados difíceis de manipular.

    Data Scraping (raspagem de dados) é uma técnica que coleta dados de bases de dados complexas (com muitas tabelas e relacionamentos) ou de sites de difícil navegabilidade, processa automaticamente esses dados e os exibe de uma forma mais legível – ele transforma dados pouco estruturados em dados mais estruturados e fáceis de manipular. (LETRA - C)

    As ações inerentes ao processo de preparação de dados incluem detecção de anomalias, deduplicação e desambiguação de entradas.

    A mineração ocorre após a preparação dos dados. Não há como minerar dados (explorar em busca de padrões e informações úteis) sem antes preparar esses dados. (LETRA - D)

    O Big Data foi inicialmente conceituado com base apenas em três premissas básicas: Volume, Velocidade e Variedade (3 V’s). Atualmente a definição de Big Data pode ser quebrada em 05 dimensões, quais sejam: (LETRA - E)

    - Volume = grande quantidade de dados gerada a cada segundo. 

    Velocidade = Refere-se à velocidade com que os dados são criados e tratados para atender à demanda. Trata-se da existência de um alto fluxo de dados na entrada, impactando o modelo de processamento e armazenamento. 

    Variedade = Significa que os dados de hoje aparecem em todos os tipos de formatos, como, por exemplo, arquivos de texto, e-mail, medidores e sensores de coleta de dados, vídeo, áudio, dados de ações do mercado ou transações financeiras. Trata dos diferentes tipos de dados (estruturados e não-estruturados) advindos de fontes diversas.

    Veracidade = A informação deve ser verdadeira. 

    Valor = definir a abordagem que será feita da massa de dados que circula. Não é toda a informação que está circulando que é relevante ou útil para os objetivos específicos de uma empresa.

    As características da variedade e do valor nos diz que a qualidade do dado é importante.

  • Gabarito: C.

    "Scraper" é uma forma genérica de dizer "raspar". Na realidade, o "scraper" advém da "web scraping" ou "coleta de dados da web."

    De maneira resumida, você tem um local que de seja retirar os dados, como uma página web qualquer. Ao utilizar o scraper, você retira os dados da página e joga eles em planilhas, tornando-os estruturados. Atualmente, isso é feito utilizando bots programados. Salienta-se, que embora projetada para um impacto benéfico, há também o lado negativo. Existem desenvolvedores que utilizam o scraper para garimpar informações e armazenar dados, repassar e etc. Geralmente, quando isso ocorre, os bots sobrecarregam os servidores, fazendo com que eles fiquem inacessíveis pelos usuários.

    Bons estudos!

  • RESPOSTA: LETRA C

    (B) : Não existe nenhuma obrigação dos sistemas serem estruturados em um cluster e usarem computação distribuída.

    (C) Data Scraping é basicamente é uma técnica que coleta dados de bases de dados complexas (com muitas tabelas e relacionamentos) ou de sites de difícil navegabilidade, processa automaticamente esses dados e os exibe de uma forma mais legível – ele transforma dados pouco estruturados em dados mais estruturados e fáceis de manipular. 

  • Mineração de Dados

    Letra D - Errada

    Etapas:

    1- Preparação dos dados -> Seleção dos dados

    2- Mineração de dados -> transforma em relatórios/gráficos

    3- Análise dos dados -> Compreensão dos dados

  • Big Data: sob o ponto de vista empresarial: refere-se à grande oportunidade que as empresas têm que é a de extrair efetiva inteligência de negócios a partir destes dados; as possibilidades trazidas pelo Big Data são enormes e essas novas possibilidades fazem com que a organização repense no que é possível ou não inferir a partir dos dados, o que acaba invariavelmente alterando seus processos e sua visão;

    ► Ferramentas de análise específicas, também conhecidas como "Analytics": permitem a implementação de estratégias para conhecer e fidelizar melhor seus clientes, reduzir custos operacionais e melhorar seus produtos;

    ◙ No Big Data: apesar de ser possível a utilização de indicadores e modelos simples como o BI, na maior parte das vezes, os projetos tem sua orientação na análise preditiva, com algoritmos diversos e complexos que buscam prever o que acontecerá, em cenários que isso não é facilmente determinável; e em análise prescritiva (que buscam a recomendação de o que fazer em cenários diversos e não previsíveis);

    Sistemas de Recomendação: são baseados em análise prescritiva e recomendam ações de acordo com seus algoritmos previamente definidos em projeto; de forma que a recomendação não possui como foco os tipos de dados, tampouco o processamento de grandes volumes de dados;

    Data scraping: é a técnica de extração de dados de sites e transportá-los para um formato mais simples e maleável, afim de serem analisados e cruzados com mais facilidade;

    ► Em vários casos, os dados necessários para um trabalho de análise estão disponíveis, porém em sites de navegabilidade ruim ou em bancos difíceis de manipular.

    ► Para coletar automaticamente e visualizar essas informações, recorre-se a softwares conhecidos como scrapers;

    ================================

    Fonte(s): Thiago Cavalcanti, TEC;

  • Acerca de big data: e) O termo big data se baseia em cinco Vs: velocidade, virtuosidade, volume, vantagem e valor. FALSO

    ===================================

    Big Data: é um termo utilizado para se referir a grandes conjuntos de dados que são de difícil processamento em bancos de dados e programas tradicionais.

    ► Logo, as ferramentas e sistemas associados a big data são mais voltados a trabalhar com grandes conjuntos de dados predominantemente não-estruturados, possibilitando a extração de algum tipo de utilidade disso tudo;

    ► Note que os dados não são exclusivamente não-estruturados, também pode haver dados estruturados aí no meio!!

    ◙ Visto que a tarefa de de classificar um conjunto de dados como sendou não "big data" é bastante complicado, as características associadas a big data foram consolidadas em um conceito chamado de três Vs (Laney, 2001):

    Volume: refere-se à quantidade de dados produzidos; o conceito de big data, como o próprio nome já diz, está associado a enormes conjunto de dados;

    Velocidade: está relacionado à rapidez com que esses dados são gerados e atualizados;

    Variedade: é um conceito associado às diferentes estruturas em que os dados se encontram hoje em dia; big data envolve dados estruturados, semiestruturados e não-estruturados dos mais diversos tipos e formatos;

    ◙ Veja, então, que big data seriam os conjuntos de dados que apresentagem as características informadas acima; porém, mais recentemente, têm sido considerados mais dois conceitos:

    Veracidade: tem maior preocupação com a confiabilidade e com a organização dos dados; ou seja, as tecnologias de big data devem permitir trabalhar com conjuntos de dados irregulares e que nem sempre são confiáveis; temos que o volume muitas vezes compensa a falta de veracidade nos registros;

    Valor: é uma das características mais importantes e mais simples de se entender do big data: podemos ter ferramentas que nos permitam coletar, processar e analisar dados que se amoldem aos outros quatros Vs; contudo, se não conseguirmos extrair algo de valor disso tudo, o big data se torna somente mais uma "armadilha" para o desperdício de recursos das organizações;

    ===================================

    Fonte(s): Arthur Mendonça, Direção;

  • Letra c.

    a) Errada. A utilização de Big Data nas organizações será capaz de transformar os seus processos de gestão e cultura.

    b) Errada. Um Sistema de Recomendação combina várias técnicas computacionais para selecionar itens personalizados com base nos interesses dos usuários e conforme o contexto no qual estão inseridos. Tais itens podem assumir formas bem variadas como, por exemplo, livros, filmes, notícias, música, vídeos, anúncios, links patrocinados, páginas de internet, produtos de uma loja virtual, etc. Empresas como Amazon, Netflix e Google são reconhecidas pelo uso intensivo de sistemas de recomendação com os quais obtém grande vantagem competitiva.

    c) Certa. De acordo com Wikipedia (2017), Data Scraping (ou raspagem de dados) é uma técnica na qual um programa de computador extrai dados de saída legível para humanos, proveniente de um outro programa, e disponibiliza esses dados de modo que se tornem legíveis para outros programas de computador.

    d) Errada. Preparação de dados é o processo de coletar, limpar, normalizar, combinar, estruturar e organizar dados para análise. Ele é o passo inicial (e fundamental) para que o trabalho com Big Data, uma vez que aumenta a qualidade dos dados – e, consequentemente, dos resultados com mineração de dados. Dados “pobres”, de qualidade ruim, geram resultados incorretos e não confiáveis ao fim do processo.

    Deduplicação é o processo de analisar, identificar e remover duplicidade nos dados, diminuindo assim a quantidade de informação a ser manipulada e armazenada. Minerar dados consiste no uso de um conjunto de tecnologias e técnicas que permitem automatizar a busca em grandes volumes de dados por padrões e tendências que não são detectáveis por análises mais simples. Este tipo de análise dá aos gestores embasamento de alto valor para tomada de decisões estratégicas, permitindo detectar de forma precoce a ocorrência de tendências do mercado e antecipar suas ações para responder a novos cenários.

    e) Errada. As 5 Dimensões (5 V´s) do Big Data são: Volume, Variedade, Velocidade, Veracidade, Valor.

    Fonte: Grancursos.

  • Big data é formado por 5 V's: Velocidade

    Volume

    Variedade

    Veracidade

    Valor

  • (a) Errado. Como é? Big Data tem sido revolucionário em muitas organizações! Big Data tem modificado processos de gestão e cultura de diversas organizações por meio da descoberta de novas informações para tomadas de decisão estratégicas;

    (b) Errado. Sabem quando a Netflix te recomenda um filme ou o Spotify te recomenda uma música/banda? Pois é, isso ocorre por meio de um Sistema de Recomendação! Ela combina várias técnicas computacionais para selecionar itens personalizados com base nos interesses dos usuários. No entanto, não existe nenhuma obrigação dos sistemas serem estruturados em um cluster e usarem computação distribuída. O que é isso, Diego? Cara, é basicamente uma forma de dividir um problema em várias partes para serem processados paralelamente por uma grande quantidade de computadores e posteriormente combinar o resultado;

    (c) Correto. Professor, o que é Data Scraping? Basicamente é uma técnica que coleta dados de bases de dados complexas (com muitas tabelas e relacionamentos) ou de sites de difícil navegabilidade, processa automaticamente esses dados e os exibe de uma forma mais legível – ele transforma dados pouco estruturados em dados mais estruturados e fáceis de manipular. Grosso modo, podemos imaginar uma biblioteca em que o bibliotecário organizou todos os livros de acordo com tema, tamanho, data, número de identificação, etc – isso é bem estruturado; agora imagine uma biblioteca sem um bibliotecário em que as coisas são organizados de forma aleatória – isso não é bem estruturado; 

    (d) Errado. Todas essas ações são realmente inerentes ao processo de preparação de dados (Data Preparation), exceto a mineração de dados! Por que? Porque a mineração ocorre após a preparação dos dados! Não há como minerar dados (explorar em busca de padrões e informações úteis) sem antes preparar esses dados. Além disso, não é obrigatória a preparação dos dados;

    (e) Errado. Virtuosidade e Vantagem não fazem parte dos 5 Vs do Big Data. 

    Fonte: Estratégia Concurso.

  • Os scrapers sob diversas óticas.

    Pode-se recorrer a software conhecidos como scrapers para coletar automaticamente e visualizar dados que se encontram disponíveis em sítios de navegabilidade ruim ou em bancos de dados difíceis de manipular.

    ◙ Data scraping: é a técnica de extração de dados de sites e transportá-los para um formato mais simples e maleável, afim de serem analisados e cruzados com mais facilidade;

     Data Scraping (ou raspagem de dados) é uma técnica na qual um programa de computador extrai dados de saída legível para humanos, proveniente de um outro programa, e disponibiliza esses dados de modo que se tornem legíveis para outros programas de computador.

  • Pode-se recorrer a software conhecidos como scrapers para coletar automaticamente e visualizar dados que se encontram disponíveis em sítios de navegabilidade ruim ou em bancos de dados difíceis de manipular.

  • Data Scraping: técnica que coleta dados de bases de dados complexas (com muitas tabelas e relacionamentos) ou de sites de difícil navegabilidade, processa automaticamente esses dados e os exibe de uma forma mais legível – ele transforma dados pouco estruturados em dados mais estruturados e fáceis de manipular.

    Professor Diego Carvalho - Estratégia

  • Em 10/07/21 às 11:19, você respondeu a opção D.! Você errou!

    Em 03/07/21 às 10:35, você respondeu a opção B.! Você errou!

    Em 30/06/21 às 10:02, você respondeu a opção D.! Você errou!

    Em 24/02/21 às 09:48, você respondeu a opção D.! Você errou!

    Em 09/02/21 às 18:39, você respondeu a opção E.! Você errou!