SóProvas


ID
1001704
Banca
CESPE / CEBRASPE
Órgão
MPOG
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere às técnicas de recuperação de informações usadas em bancos de dados textuais, julgue os itens que se seguem.

A técnica denominada extração de termos (term extraction) compreende a análise de especialistas no domínio do texto e a incorporação de informações linguísticas às informações estatísticas sobre os termos do documento.

Alternativas
Comentários
  • A extração de termos é um procedimento árduo que requer atenção e cuidado por parte do profissional que o executa. Deve-se, em todas as etapas do processo, adotar uma diretriz que possa ser utilizada por todos os profissionais que forem realizar a extração a fim de que haja uniformização das estratégias utilizadas na extração de termos e para que não se perca dados relevantes. Os termos extraídos devem ser transcritos em uma ficha terminológica para a construção do corpus de análise que deverá ser arquivado para posterior avaliação quanto ao contexto no qual o termo foi extraído e, assim, auxiliar na categorização do mesmo segundo os sete eixos da CIPE®- Versão 1.0. Os dados da ficha terminológica também devem ser utilizados para alimentar uma planilha do a fim de serem excluídas as repetições, o que é realizado com o auxílio do programa.
    Processo de normalização de termos  Após a eliminação das repetições, o próximo passo é submeter os termos a correções de ortografia, análise de sinonímia, adequação de tempos verbais, uniformização de gênero (feminino, masculino) e número (singular, plural) e exclusão de expressões pseudoterminológicas. Na análise dos termos obtidos é comum identificar-se erros de ortografia que precisam ser corrigidos. Um termo digitado erroneamente não é considerado pelo sistema como um termo idêntico ao termo redigido corretamente e, deste modo, o programa não o exclui. Questão: CORRETA