SóProvas


ID
2635120
Banca
CESGRANRIO
Órgão
Petrobras
Ano
2018
Provas
Disciplina
Programação
Assuntos

Dois funcionários de uma empresa de crédito discutiam sobre quais algoritmos deveriam usar para ajudar a classificar seus clientes como bons ou maus pagadores. A empresa possui, para todos os empréstimos feitos no passado, um registro formado pelo conjunto de informações pessoais sobre o cliente e de como era composta a dívida inicial. Todos esses registros tinham classificações de bons ou maus pagadores, de acordo com o perfil de pagamento dos clientes. A partir desses dados, os funcionários querem construir um modelo, por meio de aprendizado de máquina, que classifique os novos clientes, que serão descritos por registros com o mesmo formato.


A melhor opção, nesse caso, é usar um algoritmo

Alternativas
Comentários
  • Alternativa A)

    O algoritmo SVM (Support Vector Machines) estuda e analisa dados com o objetivo de reconhecimento de padrões.

  • O kmean também faz isso, mas com técnicas diferentes. Não deixa de fazer a classificação (supervisão).

  • Máquinas de vetores de suporte (SVM) - Conjunto relacionado de métodos de aprendizado supervisionado usados para classificação e regressão. Dado um conjunto de exemplos de treinamento, cada um marcado como pertencente de uma ou duas categorias, um algoritmo de treino SVM constrói um modelo que prediz se um novo exemplo cai dentro de uma categoria ou outra.

  • Algoritmos de aprendizagem supervisionada, são necessários dados rotulados, que são os dados de entrada associados com o resultado esperado:

    1. Regressão Linear - O objetivo é prever o valor de uma variável contínua. A regressão linear assume que existe uma relação linear entre a variável resposta e a variável explicativa.
    2. Support Vector Machines - toma como entrada um conjunto de dados e prediz, para cada entrada dada, qual de duas possíveis classes a entrada faz parte.
    3. Árvore de Decisão - estrutura que armazena regras de decisão e possui nós, ramos e folhas. Os nós representam as variáveis, os ramos representam os valores possíveis de cada nó e as folhas representam o valor final de um nó.
    4. Naive Bayes - é um classificador probabilístico baseados em Redes Bayesianas utilizada para classificação, bem como sua comparação com a técnica de Regressão Logística. que desconsidera a correlação entre as variáveis.

    Algoritmos de aprendizagem não supervisionada, não temos os dados rotulados, ou seja, quando não temos a saída esperada para uma determinada entrada: 

    1. K-means - O objetivo desse algoritmo é dividir os dados em grupos com base na similaridade dos dados (

    clusters).

    Aprendizado de maquina semi-supervisionado tem como proposta de um algoritmo para rotular exemplos a partir de poucos exemplos rotulados. Assim utiliza técnicas de aprendizado não supervisionado (para aprender a estrutura dos dados).

    fonte: Enap Fundação Escola Nacional de Administração Pública

  • (A) supervisionado, como SVM - Resposta correta. Trata-se de um aprendizado supervisionado com particionamento.

    (B) supervisionado, como K-means - K-means é um algoritmo usado para clusterização, ou seja, é não supervisionado

    (C) não supervisionado, como regressão linear - Regressão Linear é dado por uma equação de reta, mas trata-se de um aprendizado supervisionado

    (D) não supervisionado, como árvores de decisão - em árvore de decisão há rótulos e esquemas pré-definidos. Isso caracteriza aprendizado supervisionado.

    (E) semi-supervisionado, como redes bayesianas - A questão afirma "Todos esses registros tinham classificações de bons ou maus pagadores" o que deixa evidente que não se trata de um aprendizado semi-supervisionado.

  • Como já conhecemos as classes e já temos um conjunto de dados passados já rotulados, a partir dos quais será construído o modelo, percebemos que se trata de um modelo de aprendizado supervisionado. Um exemplo desse tipo de algoritmo são as SVMs (support vector machines), que usam a separabilidade entre os membros das classes para realizar a classificação.

    O erro da alternativa B é falar do k-means, que é um algoritmo de clusterização não supervisionado.

    Outros modelos supervisionados poderiam ser a regressão linear, as árvores de decisão, o Naive Bayes, o k-Nearest Neighbor... enfim, várias possibilidades!

  • Como já conhecemos as classes e já temos um conjunto de dados passados já rotulados, a partir dos quais será construído o modelo, percebemos que se trata de um modelo de aprendizado supervisionado.

    Um exemplo desse tipo de algoritmo são as SVMs (support vector machines), que usam a separabilidade entre os membros das classes para realizar a classificação.

    O erro da alternativa B é falar do k-means, que é um algoritmo de clusterização não supervisionado.

    Outros modelos supervisionados poderiam ser a regressão linear , as árvores de decisão, o Naive Bayes, o k-Nearest Neighbor... enfim, várias possibilidades!

    SVM: https://www.youtube.com/watch?v=ba7tMJZbGyA

    K-means: https://www.youtube.com/watch?v=WqMnQuC19Rg&t=219s