SóProvas


ID
5261971
Banca
CESPE / CEBRASPE
Órgão
SERPRO
Ano
2021
Provas
Disciplina
Banco de Dados
Assuntos

Sobre as técnicas de classificação em aprendizado de máquina, julgue o item a seguir.

Devido ao fato de pressupor independência entre atributos, o algoritmo Naive Bayes é capaz de realizar, com precisão, o treinamento de um modelo com uma quantidade reduzida de amostras.

Alternativas
Comentários
  • Naive Bayes.

    1. Passos

    1.1 Ter uma tabela de frequências

    1.2 Ter uma tabela de probabilidades

    1.3 Utilizar o teorema de Bayes: P(A|B) = P(B|A)•P(A)/P(B)

    .

    2. Supõe que os atributos vão influenciar a classe DE FORMA INDEPENDENTE

    .

    3. Aplicações

    3.1 Previsões multi-classes;

    3.2 Classificação de textos/Filtragem de spam/Análise de sentimento;

    3.3 Previsões em tempo real;

    3.4 Sistema de Recomendação.

    .

    4. Vantagens

    4.1 Simplicidade

    4.1.1 É um classificador muito simples (ingênuo).

    4.2 Facilidade e velocidade

    4.2.1 É fácil e rápido para prever o conjunto de dados da classe de teste.

    4.3 Desempenho

    4.3.1 Classes múltiplas

    4.3.1.1 Tem um bom desempenho na previsão de classes múltiplas.

    4.3.2 Variáveis categóricas

    4.3.2.1 O desempenho é bom em caso de variáveis categóricas de entrada em comparação a variáveis numéricas.

    4.4 Distribuição normal

    4.4.1 Para variáveis numéricas, assume-se a distribuição normal (curva de sino, que é uma suposição forte).

    .

    5. Desvantagens

    5.1 Zero frequency

    5.1.1 Se a variável categórica tem uma categoria que não foi observada no conjunto de dados de treinamento, então o modelo irá atribuir uma probabilidade 0 (zero) e não será capaz de fazer uma previsão.

    5.1.2 Isso é muitas vezes conhecido como “Zero Frequency”.

    5.2 Atributos independentes

    5.2.1 Uma limitação do Naive Bayes é a suposição de preditores independentes.

    5.2.2 Na vida real, é quase impossível ter um conjunto de indicadores que sejam completamente independentes

    Citou um dos termos chave do método: independência entre os atributos

    Gabarito: Certo

  • Gabarito: CERTO

    Se pudermos definir o algoritmo Naive Bayes em poucas palavras podemos dizer que ele é um classificador probabilístico que pressupõe uma independência entre os atributos dos dados.

    Podemos pontuar uma desvantagem e uma vantagem. A desvantagem consiste no fato de haver independência entre os atributos, por isso ele não consegue capturar todas as interações entre os atributos.

    Já quando pensamos na vantagem iremos citar, exatamente, o que diz no item. O Naive Bayes, por supor a independência entre os atributos é capaz de fazer o treinamento de um modelo com um número muito pequeno de amostras.

    Dessa forma, o item é correto, pois corrobora com aquilo que é dito sobre esse algoritmo.

    Uma vantagem desse modelo é que, por supor uma independência entre os atributos, ele é capaz de fazer o treinamento de um modelo com um número pequeno de amostras. (Uma desvantagem é que o modelo não conseguirá capturar as interações entre os atributos.) Esse modelo simples também pode trabalhar com dados que tenham vários atributos. Desse modo, serve como um bom modelo de base.

    Fonte: Referência: Harrison, Matt. Machine Learning - Guia de referência rápida

  • Correto. O Naive Bayes é um algoritmo simples de classificação, que só precisa de um conjunto pequeno de amostras para que possa aprender. Isso se deve à assunção de que as variáveis são independentes entre si, o que faz com que possamos utilizar as frequências dos valores das variáveis no conjunto de treinamento para estabelecer suas probabilidades e utilizarmos o teorema de Bayes para calcular a previsão.

  • O Naive Bayes é um algoritmo simples de classificação, que só precisa de um conjunto pequeno de amostras para que possa aprender. Isso se deve à assunção de que as variáveis são independentes entre si, o que faz com que possamos utilizar as frequências dos valores das variáveis no conjunto de treinamento para estabelecer suas probabilidades e utilizarmos o teorema de Bayes para calcular a previsão.

  • Fiquei na dúvida pelo trecho 'com precisão', Navie Bayes, não tem muita precisão.

  • Há uma certa subjetividade nessa questão. Visto que trabalhar com amostras reduzidas é um processo que pode levar a um certo viés nos resultados, promovendo uma baixa precisão. Imaginem que eu retiro parte do meu dataset de modo aleatório e, com isso, promovo um desbalanceamento nos dados, isto tornará o resultado tendencioso.

    Mas, a interpretação da banca não é essa, redução das amostras não promoverá desbalanceamento ou vieses. A característica no subconjunto continuará similar ao conjunto.

  • Esta questão está mal escrita.

    • Naive bayes não assume indpendência entre atributos, mas, sim, independência condicional entre atributos. Isso quer dizer que p(X1,X2|C) = p(X1|C)p(X2|C). Não podemos afirmar que p(X1|X2) = p(X1)
    • O que é realizar com precisão o treinamento?
  • Bayesian classifiers have also exhibited high accuracy and speed when applied to large databases.