-
Clustering é uma técnica de Data Mining para fazer agrupamentos automáticos de dados segundo seu grau de semelhança. O critério de semelhança faz parte da definição do problema e, dependendo, do algoritmo.
O procedimento de Clustering também pode ser aplicado a bases de texto utilizando algoritmos de Text Mining, onde o algoritmo procura agrupar textos que falem sobre o mesmo assunto e separar textos de conteúdo diferentes.
-
O índice clustering é construído sobre um campo de ordenação que não é um campo chave e por isso, diversos registros do arquivo podem ter o mesmo valor para esse campo
-
Q268200
-
Índices de agrupamento podem ser definidos em atributos não chave, para aqueles campos que servem também como atributo de ordenação em um arquivo de dados ordenado. Como esses atributos não chave não possuem valores únicos (distintos) para a classificação, o índice faz referência à primeira ocorrência de cada valor na estrutura de armazenamento.
Gabarito: C
-
Quando tratamos de índices em banco de dados, podemos de forma resumida classifica-los em três categorias:
Índice primário => baseado na chave de ordenação;
Índice de agrupamento (clustering) => baseado no campo de ordenação não-chave de um arquivo.
Índice secundário => baseado em qualquer campo não ordenado de um arquivo.