A questão me faz lembrar do famoso caso de regras de associação que indentificou que os homens que compravam fraldas para seus filhos compravam também cerveja para consumo enquanto cuidavam das crianças e assistiam aos jogos.
Regras de associação: identificação de grupos de dados que apresentam coocorrência entre si, por exemplo, uma cesta de compras. A tarefa de descoberta de associações compreende a busca por itens que frequentemente ocorrem de forma simultânea em uma quantidade mínima de transações do conjunto de dados.
Classificação: aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente. Ou seja, nessa tarefa, os atributos do conjunto de dados são divididos em dois tipos. Cada atributo do primeiro tipo é denominado atributo previsor. O segundo tipo é denominado atributo alvo. Para cada valor distinto do atributo alvo tem-se uma classe que normalmente corresponde a um rótulo categórico pertencente a um conjunto pré-definido. A tarefa de Classificação consiste em descobrir uma função que mapeie um conjunto de registros em um conjunto de classes.
Regressão ou Predição: aprendizado de uma função que pode ser usada para mapear os valores associados aos dados em um ou mais valores reais. Nesse sentido, esta tarefa é similar à tarefa de Classificação, com a diferença de que o atributo alvo assume valores numéricos.
A Regressão Linear busca encontrar a melhor linha de ajustamento para duas variáveis, desde que uma possa ser predita pela outra. A Regressão Linear tem como objetivo fornecer uma previsão de certos dados de acordo com uma série histórica, que deve seguir um modelo linear, ou seja, deve se ‘encaixar’ melhor por uma reta que representa os dados. Geralmente, os problemas que a Regressão Linear auxilia estão relacionados à previsão da quantidade de itens em um determinado momento ou à previsão populacional. A Regressão Múltipla é uma extensão da regressão linear, onde duas ou mais variáveis são envolvidas e os dados são combinados numa superfície multidimensional.
Profiling: refere-se ao processo de construção e aplicação de perfis de usuários gerados pela análise de dados computadorizada. Esse processo envolve o uso de algoritmos ou outras técnicas matemáticas que permitem a descoberta de padrões ou correlações em grandes quantidades de dados. Quando esses padrões ou correlações são usados para identificar ou representar pessoas, eles podem ser chamados de profiling.
Portanto, temos o seguinte:
a) o caso em tela, apesar de fazer correlações, não é utilizado para identificar ou representar pessoas
b) gabarito. Trata-se de regras de associação
c) a questão não pretende fazer previsão, não busca prever resultados.
d) a questão não pretende fazer previsão, não busca prever resultados, não busca saber quantidades, bem como envolve apenas duas variáveis.
e) as classes não estão predefinidas.