Questão Q978953

Em relação à classificação de textos em Recuperação de Informação, é correto afirmar:

Alternativas

Classificadores do tipo Bayes ingênuo estimam a probabilidade de uma classificação correta e são uma alternativa competitiva para a classificação de textos.

Entre os métodos supervisionados, o de agrupamento por particionamento é utilizando em processos de autorrotulagem.

Máquinas de vetores de suporte (em inglês, SVM) assumem que os pesos dos termos são binários, não considerando a frequência dos termos no processo de classificação.

Classificadores do tipo ensemble são metaclassificadores de técnicas baseadas em frequência de documentos de um termo.

O classificador de Rocchio é um método de ranqueamento de documentos baseado no número de links que apontam para o documento.

Comentários

O classificador multinomial Naïve Bayes é um dos modelos mais populares no aprendizado de máquina. Tomando como premissa a suposição de independência entre as variáveis do problema, o modelo de Naïve Bayes realiza uma classificação probabilística de observações, caracterizando-as em classes pré-definidas.

Sendo um modelo adequado para classificação de atributos discretos, o Naïve Bayes tem aplicações na análise de crédito, diagnósticos médicos ou busca por falhas em sistemas mecânicos. (https://www.digitalhouse.com/br/blog/naive-bayes)

[...] também utilizado na área de Aprendizado de Máquina (Machine Learning) para categorizar textos com base na frequência das palavras usadas.

Entre as possibilidades de aplicações está a classificação de um e-mail como SPAM ou Não-SPAM e a identificação de um assunto com base em seu conteúdo.

B - AGRUPAMENTO É NÃO SUPERVISIONADO

C - SVM - cria um campo multidimensional para classificar os dados. Não sei se faz sentido não considerar a frequência dos dados

D - Ensambles é a combinação de classificadores

E - Classificador de Rocchio é um método de ranqueamento de documentos baseado na SIMILARIDADE (links para o documento parece o page-rank, do Google)

SóProvas

Continue usando...

O que está incluso