SóProvas


ID
779164
Banca
CESPE / CEBRASPE
Órgão
TRE-RJ
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Com referência a conceitos de banco de dados textual, julgue os
itens seguintes.

Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e descobrir informações em bases textuais escritas em linguagem natural. Com text mining é possível manipular mais facilmente informações não estruturadas, tais como notícias, textos em websites, blogs e documentos em geral.

Alternativas
Comentários
  • Resposta: C

    Refere-se ao processo de obtenção de informação de qualidade a partir de texto em línguas naturais. É inspirado na mineração de dados, que consiste em extrair informação de bancos de dados estruturados; a mineração de texto extrai informação de dados não estruturados ou semi-estruturados.

    Ganhou importância com o crescimento da Internet e dos mecanismos de busca. Com mineração de texto pode-se extrair informação relevante de uma grande base de textos, sem precisar lê-los previamente. Outra utilização seria o auxílio na navegação para encontrar o que se deseja.

    Seguindo a mesma tendência da área de mineração de dados, classificação automática de textos e agrupamento por semelhança são outras funcionalidades comumente utilizadas.

    http://pt.wikipedia.org/wiki/Mineração_de_texto
  • Gab.: CERTO!

    -A mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que os textos representam um tipo específico de dado. (E)

  • A mineração de texto (também conhecida como mineração de dados de

    texto ou descoberta de conhecimento em bancos de dados textuais) é o

    processo semiautomático de extração de padrões (informações úteis e

    conhecimento) de grandes quantidades de fontes de dados não

    estruturadas.

    A mineração de texto é semelhante a mineração de dados, na medida em que

    tem o mesmo propósito e usa os mesmos processos; mas com a mineração de

    texto, a entrada para o processo é uma coleção de arquivos de dados

    não estruturados ou semiestruturados, como documentos do Word,

    arquivos PDF, trechos de texto, arquivos XML e assim por diante.

    Gabarito: Certo.