SóProvas


ID
4832785
Banca
INSTITUTO AOCP
Órgão
MJSP
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Um cientista de dados deve utilizar uma técnica de mineração de dados que não usa regras ou árvore de decisão ou qualquer outra representação explícita do classificador, mas que usa o ramo da matemática conhecido como teoria das probabilidades para encontrar a mais provável das possíveis classificações. Sabendo disso, assinale a alternativa que apresenta corretamente o nome da técnica a ser utilizada pelo cientista de dados.

Alternativas
Comentários
  • O algoritmo “Naive Bayes” é um classificador probabilístico muito utilizado em . Baseado no “Teorema de Bayes”, o modelo foi criado por um matemático inglês, e também ministro presibiteriano, chamado  (1701 – 1761) para tentar provar a existência de Deus.

    Hoje é também utilizado na área de Aprendizado de Máquina (Machine Learning) para categorizar textos com base na frequência das palavras usadas. Entre as possibilidades de aplicações está a classificação de um e-mail como SPAM ou Não-SPAM e a identificação de um assunto com base em seu conteúdo.

    https:// www.datageeks.com.br/naive-bayes/

  • Machine Reasoning -> Raciocínio de máquina é um segmento derivado da Inteligência Artificial que consiste em permitir que as máquinas consigam fazer conexões entre fatos, observações e outros conteúdos disponíveis

    Regressão linear -> É um algoritmo supervisionado de machine learning usado para estimar o valor de algo baseado em uma série de outros dados históricos, portanto olhando para o passado você pode “prever” o futuro.

    Existem 2 tipos de regressão linear: simples e a múltipla.

    Regressão linear simples : refere-se quando temos somente uma variável independente (X) para fazermos a predição.

    Regressão linear múltipla: refere-se a várias variáveis independentes (X)usadas para fazer a predição.

    Redes bayesianas -> Uma rede bayesiana é uma forma de representar o conhecimento de um domínio onde não se tem certeza de todas as variáveis presentes. Através da probabilidade podemos responder, com níveis de certeza, a questões formuladas com base em evidências de uma situação. 

  • ALGORITMO MUITO UTILIZADO TAMBÉM EM CORREIO ELETRÔNICO, PARA DIFERIR SE UM E-MAIL É SPAM OU NÃO.

  • Toda vez que a questão tratar de classificador probabilistico devemos pensar em Naive Bayes.

  • Gabarito: D

    O algoritmo "Naive Bayes" é um classificador probabilístico muito utilizado em machine learning. Baseado no "Teorema de Bayes", o modelo foi criado por um matemático inglês, e também ministro presbiteriano, chamado Thomas Bayes (1701 – 1761) para tentar provar a existência de Deus.

    Hoje é também utilizado na área de Aprendizado de Máquina (Machine Learning) para categorizar textos com base na frequência das palavras usadas.

    Entre as possibilidades de aplicações está a classificação de um e-mail como SPAM ou Não-SPAM e a identificação de um assunto com base em seu conteúdo.

    Ele recebe o nome de "naive" (ingênuo) porque desconsidera a correlação entre as variáveis (features). Ou seja, se determinada fruta é rotulada como "Limão", caso ela também seja descrita como "Verde" e "Redonda", o algoritmo não vai levar em consideração a correlação entre esses fatores. Isso porque trata cada um de forma independente.

    Fonte: https://www.datageeks.com.br/naive-bayes/

  • Se a questão menciona classificador probabilístico ela provavelmente estará se referindo ao Naive Bayes. Esse algoritmo não representa os passos decisórios na forma de árvore nem de um conjunto de regras, mas sim através das probabilidades de ocorrências dos termos. O Naive Bayes é muito utilizado em aplicações de classificação de texto, como nos filtros anti-spam.

  • Se a questão menciona classificador probabilístico ela provavelmente estará se referindo ao Naive Bayes.

    Esse algoritmo não representa os passos decisórios na forma de árvore nem de um conjunto de regras, mas sim através das probabilidades de ocorrências dos termos.

    O Naive Bayes é muito utilizado em aplicações de classificação de texto, como nos filtros anti-spam.