SóProvas


ID
5474656
Banca
CESGRANRIO
Órgão
Banco do Brasil
Ano
2021
Provas
Disciplina
Banco de Dados
Assuntos

Um pesquisador conseguiu uma base de dados que mostrava terrenos classificados de acordo com:

• características físicas;
• tipo de negócio a ser nele implantado;
• risco esperado, que compreendia os rótulos alto, médio, baixo ou nenhum.

Decidiu, então, usar um algoritmo de aprendizado de máquina que, a partir das características físicas do terreno e do tipo de negócio a ser nele implantado, aprenderia a determinar o risco esperado, enquadrando o terreno em questão em um daqueles rótulos.

Nesse cenário, que algoritmo de aprendizado de máquina é indicado para resolver esse problema?

Alternativas
Comentários
  • "Um algoritmo de aprendizado de máquina supervisionado (em oposição a um algoritmo de aprendizado de máquina não supervisionado) é aquele que se baseia em dados de entrada rotulados para aprender uma função que produz uma saída apropriada quando novos dados não rotulados são fornecidos."

    <https://alvarezsolucoesdigitais.com/ciencia-de-dados/nocoes-basicas-de-aprendizado-de-maquina-com-o-algoritmo-k-vizinhos-mais-proximos/>

  • Resposta C: KNN (K-Nearest Neighbors).

    As outras alternativas são não-supervisionados - Clustering (Agrupamento).

    Mais:

    Algoritmos de aprendizado podem ser de Classificação, Regressão, Agrupamento ou Associação. O exemplo da questão cita rótulos pré-estabelecidos, ou seja, conhecimento prévio = aprendizagem superviosionada = Classificação.

    Isso quer dizer que as classes estão lá estabelecidas como rótulos. O algoritmo só vai comparar as características dos dados e atribuir os devidos rótulos.

    Entre os algoritmos de Classificação, estão o SVM (aquele gráfico baseado em vetor com pontos dispersos e uma reta que separa os dados conforme a sua classificação), A Análise Discriminante (), o Naive Bayes (categoriza baseado na frequência dos dados, usado em confiança na validação de captcha, ou se um e-mail é spam ou não), As Redes Neurais (rede similar ao cérebro humano, que lê entradas, estímulos e saídas e decide onde as relações são mais fortes) e o K-NN, a alternativa C, onde o K representa o nº de vizinhos comparados a uma similaridade (ex.: Compare entre os últimos K filmes vistos, para classificar preferência e recomendar novos similares para este usuário).

    Vale lembrar que os algoritmos supervisionados são Classificação e Regressão, enquanto os Não Supervisionados são Agrupamento e Associação (Macete: Se começa com A é não supervisionado).

    Mais detalhadamente, ainda existem os modos semi-supervisionado, em lote e aprendizagem por reforço.