Compressão Aplicada a Índices Invertidos
O uso de índices invertidos é uma forma eficiente para a busca de palavras em um texto. Assim como nos textos, o índice também pode ser comprimido para permitir uma busca mais eficiente. Em [2] são apresentados três tipos distintos de índices. O primeiro é o índice invertido completo, que guarda a posição exata de cada palavra no texto, e pode ser utilizado com qualquer método de compressão, pois a busca é feita utilizando a lista, e a descompressão é utilizada somente na apresentação do resultado. O segundo é o índice de arquivo invertido, que guarda o documento onde há a ocorrência de cada palavra, e apresenta dificuldades quando a busca desejada envolve uma frase, pois duas palavras podem estar em um documento sem que façam parte da mesma frase. O último é o índice de endereçamento de bloco, que divide o texto em blocos de tamanho fixo, o qual pode conter parte de ou vários documentos, ou ainda a sobreposição de limites de documentos, guardando apenas os blocos onde cada palavra possui ocorrência, servindo como um filtro que elimina os blocos que não contém a ocorrência.