SóProvas


ID
5261992
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2021
Provas
Disciplina
Banco de Dados
Assuntos

    Dados ausentes são muito comuns em aplicações que envolvem preenchimentos de formulários. Para o seu tratamento estatístico, encontra-se, na literatura, uma taxonomia para o mecanismo gerador de dados ausentes que os classifica em tipos como MAR (missing at random), MCAR (missing completely at random) e MNAR (missing not at random).
Considerando essas informações, julgue os itens subsequentes, relativos ao tratamento de dados ausentes.  

Para o tratamento estatístico de valores ausentes do tipo MCAR, é suficiente preencher com zeros as lacunas existentes em um conjunto de dados.

Alternativas
Comentários
  • Não sou especialista no assunto. Darei apenas uma opinião.

    Pelo que pesquisei, o modelo MCAR assume que a causa dos dados faltantes independe dos dados observados. Logo, o mecanismo causador pode ser ignorado. Isso leva à probabilidade aleatória de ocorrência de dados faltantes.

    Nessa questão em específico, preencher com zeros as lacunas existentes acrescentaria um dado ( 0 ) que não segue, necessariamente, a sua probabilidade de ocorrência (ocorrência de 0) nos dados observados. Logo, alteraria a inferência sobre distribuição real da população.

  • Anderson, seu raciocínio está correto. O procedimento recomendável é realizar um listwise (apagar completamente os dados daquela amostra específica - linha inteira de uma dada tabela de dados). Como as informações ausentes são aleatórias e tomando como ponto de partida uma boa população amostral, não haverá a interferência a exclusão desses indivíduos. Esta recomendação se restringe a uma pequena quantidade relativa de dados ausentes do tipo MCAR. Para situações de muitos dados ausentes, seja de qualquer tipo, não há o que se fazer.

    Peguei essas informações da apostila do curso do professor Thiago Cavalcanti (Estratégia - Cientista de Dados - Petrobras).