SóProvas


ID
2801293
Banca
CESGRANRIO
Órgão
Transpetro
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

Um desenvolvedor recebeu um conjunto de dados representando o perfil de um grupo de clientes, sem nenhuma informação do tipo de cada cliente, onde cada um era representado por um conjunto fixo de atributos, alguns contínuos, outros discretos. Exemplos desses atributos são: idade, salário e estado civil. Foi pedido a esse desenvolvedor que, segundo a similaridade entre os clientes, dividisse os clientes em grupos, sendo que clientes parecidos deviam ficar no mesmo grupo. Não havia nenhuma informação que pudesse ajudar a verificar se esses grupos estariam corretos ou não nos dados disponíveis para o desenvolvedor.


Esse é um problema de data mining conhecido, cuja solução mais adequada é um algoritmo

Alternativas
Comentários
  • Gabarito B

    Tradicionalmente, os métodos de mineração de dados são divididos em aprendizado supervisionado (preditivo) e não-supervisionado (descritivo). Apesar do limite dessa divisão ser muito tênue (alguns métodos preditivos podem ser descritivos e vice-versa), ela ainda é interessante para fins didáticos. Já existem variações entre os dois tipos de aprendizados. Seliya e Wang, são propostas abordagens semi-supervisionadas. A diferença entre os métodos de aprendizado supervisionados e não-supervisionados reside no fato de que os métodos não-supervisionados não precisam de uma pré-categorização para os registros, ou seja, não é necessário um atributo alvo. Tais métodos geralmente usam alguma medida de similaridade entre os atributos. As tarefas de agrupamento e associação são consideradas como não-supervisionadas. Já no aprendizado supervisionado, os métodos são providos com um conjunto de dados que possuem uma variável alvo pré-definida e os registros são categorizados em relação a ela. As tarefas mais comuns de aprendizado supervisionado são a classificação (que também pode ser não-supervisionado) e a regressão.

     

     

     

    "Retroceder Nunca Render-se Jamais !"
    Força e Fé !
    Fortuna Audaces Sequitur !

  • algoritmos de aprendizagem não supervisionada não supõem a classificação entre as empresas saudáveis e não saudáveis em sua base de dados. Eles simplesmente tentariam separar as empresas em questão usando as variáveis associadas as empresas e não necessariamente separariam as empresas em duas classes. Eles normalmente associam o seu aprendizado a métricas que devem ser otimizadas.

  • Gabarito B.

    não supervisionado

  • Um desenvolvedor recebeu um conjunto de dados representando o perfil de um grupo de clientes, sem nenhuma informação do tipo de cada cliente.

    Com essa informação já da pra saber que é não supervisionado.

  • Um técnica que não possui supervisionamento é a análise em agrupamento (clusters) , em que se descobre diferentes agrupamentos de uma massa de dados e é necessário que sejam separados de forma a ajudarem na análise.

    Existem dois tipos de agrupamento: classificação e os cluters, o primeiro diferencia do segundo por ser supervisionado, ou seja, possui características pré definidas, registros previamente categorizados. Diferente do que ocorre com os cluters que são NÃO SUPERVISIONADOS (não previamente categorizados).

    Logo, o que encaixa melhor na alternativa é o NÃO SUPERVISIONADO.

  • Errei porque a questão fala que havia dados CONTÍNUOS e discretos. Dados continuos você só obtem através de um algoritmo de regressão, e esse algoritmo é do tipo supervisionado. Como a questão citou os 2 tipos de dados eu achei que seria semiSupervisionado.