SóProvas


ID
2646217
Banca
CESPE / CEBRASPE
Órgão
TCM-BA
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

Acerca de visualização e análise exploratória de dados, assinale a opção correta.

Alternativas
Comentários
  • O que é arquivo CSV?

    CSV (Comma-Separated Values) é um formato simples de armazenamento, que agrupa as informações de arquivos de texto em planilhas, para as trocas de dados com um banco de dados ou uma planilha entre aplicativos. Cada linha em um texto CSV representa uma linha em uma planilha. Cada célula é geralmente separada por vírgula ou um outro caractere, como tabulador. 

    https://ajuda.rdstation.com.br/hc/pt-br/articles/205623999-Como-eu-crio-um-arquivo-CSV- 

  • Indiquei para comentário esta questão. Abaixo o que eu, que nada tenho de conhecimento na área, garimpei em diversos textos e trabalhos publicados na internet sobre AED.

     

    a) As variáveis são características que podem ser observadas ou medidas em cada elemento pesquisado, sendo classificadas em inteiras, textuais ou imagens. ERRADA. Temos por nível de MANIPULAÇÃO - DEPENDENTE  E INDEPENDENTE - e por nível de MENSURAÇÃO, podendo ser QUANTITATIVO ou QUALITATIVO.

     

    b) A entrada de dados deve assumir convenções tais como: os dados devem estar no formato de matriz; cada linha da matriz deve ter pelo menos um atributo identificador; e cada coluna da matriz deve ter um nome distintoERRADA. Encontrei em um trabalho na internet: Os dados aparecem na forma de uma matriz, usualmente com as colunas indicando as variáveis e as linhas os indivíduos (ou elementos).

     

    c) A informação de uma ou mais variáveis que não estiver disponível (por exemplo, falta de resposta, rasura etc.) deve ser marcada (ou indicada) com zeroERRADA Encontrei em diversos estudos e trabalhos publicados sobe AED a seguinte explicação quanto à dados não disponívels: Há basicamente cinco cursos de ação possíveis: (a) a eliminação completa do registro, (b) a eliminação parcial do registro, (c) o preenchimento com base na média da variável, (d) o preenchimento por interpolação, ou (e) a criação da categoria "não respondeu".

     

    d) CORRETA.

     

    e) A eliminação completa (casewise deletion) consiste em eliminar os arquivos que apresentem mais de um dado perdido.  ERRADA. A eliminação completa ("casewise deletion") consiste em simplesmente eliminar todos os casos (linhas) que apresentem pelo menos um dado perdido.

  • Como abrir e ler um arquivo CSV

    A estrutura de um arquivo CSV é semelhante a um Excel, e o formato CSV é de texto simples que faz com que os dados fácil de ser importado para qualquer programa de planilha ou banco de dados, independentemente do tipo de programa de computador ou software que você está usando.

    Portanto, o arquivo CSV pode ser aberto, ler e editar por muitos programas de planilha, como o Microsoft Excel ou Open Office Calc, e algum outro editor de documentos, como o Google Docs, o bloco de notas também pode ser usado para abrir e editar o arquivo CSV.

    Retirado aqui: https://www.leawo.com/pt/knowledge/what-is-csv-file-csv-contact.html

     

  • a) As variáveis podem ser classificadas em nível de mensuração (qualitativas ou quantitativas) e em nível de manipulação (dependentes ou independentes). ERRADA

    b) A entrada de dados nos sistemas de análise exploratória geralmente segue um padrão bidimensional, como se fosse uma tabela de um banco de dados ou uma planilha, formato que contém linhas e colunas. Esse formato é conhecido como matriz. Contudo, ao contrário de uma tabela em um BD, a análise exploratória não tem essa exigência de que haja um atributo identificador. Por fim, temos que os nomes das colunas (as variáveis) devem ser sim destintos, para que possamos acessar cada uma pelo seu nome. ERRADA

    c) Há inúmeros tratamentos possíveis para os valores ausentes das variáveis, incluindo a deleção ou a atribuição de algum tipo de valor. Assim, não podemos ser taxativos e dizer que devemos necessariamente incluir o valor zero. ERRADA

    d) Os arquivos .csv costumam ser uma das fontes disponíveis para a extração de dados. Esse formato, bastante simples, está organizado de forma que as colunas estão separadas por vírgulas e as linhas separadas por quebras de linha. Esses arquivos podem ser abertos em qualquer editor de textos (como o bloco de notas) ou de planilhas (como o Excel ou o Calc). CERTA

    e) A eliminação completa ou casewise deletion consiste e em eliminar do conjunto de dados todos aqueles registros que apresentem qualquer um dos valores ausentes. ERRADA

  • A eliminação casewise deletion diz respeito ao apagamento de todos os registros na tabela que estão ausentes, não à extinção de um arquivo. Por exemplo, em uma tabela com os nomes dos carros, para o Celta não consta o consumo de litro / km, daí deletamos o celta de nossa tabela. Se outro carro, digamos que o Logan, apareceu sem informação sobre número de marchas (é só um exemplo qualquer), removemos ele da nossa tabela.

  • Assertiva D

    Um arquivo csv (comma separated values), no qual as colunas de um conjunto de dados são separadas por vírgula, pode ser aberto em qualquer editor de texto ou planilha eletrônica.

  • Ok, mas qualquer é muito forte.

  • Questão corrigida pelo professor Arthur Mendonça.

    https://youtu.be/JsGG4AG043w?t=11015

    Começa a partir de 03:03:35