-
O processo de Mineração de Textos tem como objetivo a busca de informações relevantes e a descoberta de conhecimentos significativos a partir de documentos textuais. Este processo envolve um grau de dificuldade significativo considerando que as informações normalmente estão disponíveis em linguagem natural, sem a preocupação com a padronização ou com a estruturação dos dados. Em geral, este processo é dividido em três etapas: Pré-processamento dos Dados, Análise e Extração do Conhecimento e Pós-processamento.
-
https://www.maxwell.vrac.puc-rio.br/11675/11675_4.PDF
Vi esquemas com três e cinco etapas.
-
Etapas da Metodologia de Mineração de Textos
Coleta: Formatação da base de documentos ou Corpus. (Robôs de Crawling atuando em qualquer ambiente.
Pré-Processamento: Preparação dos dados. (Processamento de Linguagem Natural[PLN]).
Indexação: Objetivo acesso rápido, busca. (Recuperação de Informação [IR]).
Mineração: Cálculos, inferências e extração de conhecimento. (Mineração de Dados[DM]).
Análise: Análise humana. Navegação. (Leitura e Interpretação dos dados).
Gabarito: E.
Fonte:
-
A mineração de textos pode conter várias etapas, mas quatro delas são básicas em todos os processos:
coleta de documentos,
pré-processamento,
extração de conhecimento e
avaliação e interpretação dos resultados (MARTINS et al., 2003).
Fonte: http://www.revistas.udesc.br/index.php/reavi/article/viewFile/6750/6415
-
Araújo Junior e Tarapanoff (2006) preveem quatro etapas no processo de Mineração de textos:
1 - Aquisição da informação
2 - Extração
3 - Agrupamento
4 - Apresentação
-
"Para Polanco & François (2000) a mineração de textos consiste na extração de informações sobre tendências ou padrões em grandes volumes de documentos textuais [...] afirmam que a mineração de textos pode ser subdividida em cinco passos:
1 - Seleção de dados;
2 - Extração de termos e filtragem;
3 - Agrupamento de dados;
4 - Mapeamento dos agrupamento ou visualização;
5 - Resultado e interpretação" (ARAÚJO JÚNIOR, 2007, p. 57)
ARAÚJO JÚNIOR, Rogério Henrique de. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2007.