-
Todos os dias, "coisas" se conectam à internet com a capacidade para compartilhar, processar, armazenar e analisar um volume enorme de dados entre si. Essa prátia é o que une o conceito de IoT ao de big data. Big data é um termo em evolução que descreve qualquer quantidade volumosa de dados estruturados, semiestruturados ou não estruturados que têm o potencial de ser explorados para obter informações.
....
O conceito de big data pode implicar, junto com o de data science, a capacidade de transformar dados brutos em gráficos e tabelas que permitam a compreensão do fenômeno a ser demonstrado;
Fonte: A internet das coisas. Eduardo Magrani
GABARITO ALTERNATIVA D
-
Letra (d)
Dados do Big Data:
1. Estruturada, em que os dados podem ser armazenados, acessados e processados em formato fixo, como, por exemplo, uma tabela em um banco de dados relacional;
2. Não-estruturada, em que os dados apresentam formato ou estrutura desconhecidos, em que não se sabe extrair os valores desses dados em forma bruta.
Como exemplo, têm-se as saídas da pesquisa do Google, que é uma fonte de dados heterogênea contendo uma combinação de arquivos de texto simples, imagens, vídeos, etc.;
3. Semiestruturada, em que os dados consistem de marcações internas que identificam e separam elementos de dados em uma estrutura (metadados), permitindo agrupamento de informações e hierarquias.
Como exemplo, têm-se dados de e-mail, dados de arquivos XML, JSON, e base de dados NoSql.
-
A questão é um pouco confusa. Dada a característica da variedade, as aplicações de big data analytics trabalham com dados estruturados, semiestruturados e não estruturados. Além disso, na minha visão, quando falamos de dados brutos/não processados, também estamos falando de dados não estruturados, então podemos considerá-los também.
Penso que o erro do item V diz respeito à características dos sistemas NoSQL de prescindirem de um esquema. Assim, não haveria a necessidade de gerar um esquema no momento da gravação dos dados, já que os sistemas comportariam também o armazenamento dos dados não estruturados ou semiestruturados.
-
Devem ser utilizados apenas Dados Estruturados, Dados Semiestruturados, Dados Não Estruturados e Dados Brutos.
Os Dados Brutos designam os dados/valores recolhidos e armazenados tal qual foram adquiridos, sem terem sofrido o menor tratamento. Apresentam-se como um conjunto de números, caracteres, imagens ou outros dispositivos de saídas para converter quantidades físicas em símbolos, num sentido muito extenso. No entanto, esquemas de dados gerados no momento da gravação são dados temporários e, normalmente, não são úteis como fonte de dados para Big Data Analytics.
Gabarito: Letra D
-
Devem ser utilizados apenas Dados Estruturados, Dados Semiestruturados, Dados NãoEstruturados e Dados Brutos. Os Dados Brutos designam os dados/valores recolhidos e armazenados tal qual foram adquiridos, sem terem sofrido o menor tratamento. Apresentam-se como um conjunto de números, caracteres, imagens ou outros dispositivos de saídas para converter quantidades físicas em símbolos, num sentido muito extenso. No entanto, esquemas de dados gerados no momento da gravação são dados temporários e, normalmente, não são úteis como fonte de dados para Big Data Analytics.