SóProvas



Questões de Banco de Dados Textuais


ID
104998
Banca
FCC
Órgão
TRE-AM
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

No âmbito dos bancos de dados textuais, considere:

I. Um banco de dados textual é uma coleção de documentos, que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário.

II. Aplicado ao contexto de pesquisas por frases, um arquivo invertido pode ser visto como uma lista não ordenada de palavras-chave.

III. Arquivos invertidos são tradicionalmente usados para a implementação de índices lexicográficos.

É INCORRETO o que se afirma APENAS em

Alternativas
Comentários
  • Todas as respostas encontram-se aqui:http://homepages.dcc.ufmg.br/~nivio/cursos/pa02/seminarios/seminario3/seminario3.html
  • Infelizmente ainda, questões da área de TI são elaboradas baseadas em pesquisas de textos da Internet ...

    Leoh, obrigado pelo Link!
  • Apenas complementando... o item II está errado pois:

    Um arquivo interido pode ser visto como uma lista ordenada de palavra-chave, e não como disse no item, falando que é uma lista não ordenada!

    Pode ser visto, conforme link passado abaixo:

    "Arquivos invertidos são tradicionalmente usados para a implementação de índices lexicográficos, ou seja, de índices ordenados"

  • Parabéns aos criadores do Site. Vou analisar as questões com mais atenção.
  • Gostei muito deste link sobre Bancos de dados Textuais: https://disciplinas.dcc.ufba.br/pub/MATA60/20111/Mineracao_de_Dados_e_banco_de_dados_Textuais.pdf

    Espero que ajude.
  • Fala meu Aluno(a).

    Gabarito: Letra B.

    I. Um banco de dados textual é uma coleção de documentos, que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário. CERTINHA.

    II. Aplicado ao contexto de pesquisas por frases, um arquivo invertido pode ser visto como uma lista não ordenada de palavras-chave. ERRADINHA.

    III. Arquivos invertidos são tradicionalmente usados para a implementação de índices lexicográficos. CERTINHA.

    O que é índices invertidos?

    R. É uma estrutura de dados que mapeia termos às suas ocorrências em um documento ou conjunto de documentos, armazenados em um ;

    R. É uma estratégia de  que permite a realização de buscas precisas e rápidas, em troca de maior dificuldade no ato de inserção e atualização de documentos.

    Bons Estudos!


ID
155674
Banca
CESPE / CEBRASPE
Órgão
STJ
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, que se referem a bancos de dados
textuais.

A criação de verbetes de busca é importante para auxiliar e indexar os dados em um banco textual.

Alternativas
Comentários
  • Gabarito: Certo. 

    Como funciona um banco de dados Textuais?

    R. São Banco de Dados que armazenam grandes volumes de textos, como livros acadêmicos, literários etc. em formas textuais.

    R. Um dos métodos de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os índices invertidos com contadores de posição.

    R. É permitido realizar a compactação de um banco de dados textual.

    R. Um banco de dados textual pode ser definido como um conjunto de dados inter-relacionados em um texto.

    R. Criação de verbetes de busca é importante para auxiliar e indexar os dados em um banco textual.

    Bons Estudos!


ID
155677
Banca
CESPE / CEBRASPE
Órgão
STJ
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, que se referem a bancos de dados
textuais.

A lógica de predicados não pode ser representada em um banco de dados textual.

Alternativas
Comentários
  • No banco de dados textual (BDT) exite 2 paradigmas de representação:
    • Lógica de Predicados (Lógica Clássica) - É possível representar fatos do mundo real como declarações escritas em uma forma de Fórmulas Bem Formadas (FBEs). Uma motivação importante para o uso da lógica na representação do conhecimento deve-se ao fato de que ao empregarmos frases lógicas podemos realizar deduções e raciocinar sobre o conhecimento.
    • Lógica Modal de Ação (Lógica não clássica) - É um aparato lógico que tem por objetivo representar propriedades dos constituintes de um sistema e como tais propriedades são alteradas pela execução de uma ação. Nela é possível captura a noção de seqüenciamento das ações de um texto baseadas nas informações contidas em cada cenário.
    Portanto, a lógica de predicados existe no BDT.

ID
155680
Banca
CESPE / CEBRASPE
Órgão
STJ
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, que se referem a bancos de dados
textuais.

Um banco de dados textual pode ser definido como um conjunto de dados inter-relacionados em um texto.

Alternativas
Comentários
  • Um banco de dados textual é uma coleção de documentos, que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário.
  • QUESTÃO CONCEITUAL, CORRETA.

    Outra questão sobre o assunto:

    Ano: 2010 

    Banca: Cesbraspe 

    Órgão: Banco do Amazônia  

    Quanto a bancos de dados textuais, julgue o próximo item. 

    Um banco de dados textual é uma coleção de documentos, que também pode ser visto como um longo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário. 

    GABARITO: CORRETO.

  • Gabarito: Certo.

    Como funciona um banco de dados Textuais?

    R. São Banco de Dados que armazenam grandes volumes de textos, como livros acadêmicos, literários etc. em formas textuais.

    R. Um dos métodos de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os índices invertidos com contadores de posição.

    R. É permitido realizar a compactação de um banco de dados textual.

    R. Um banco de dados textual pode ser definido como um conjunto de dados inter-relacionados em um texto.

    Bons Estudos!


ID
155683
Banca
CESPE / CEBRASPE
Órgão
STJ
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, que se referem a bancos de dados
textuais.

Em bancos de dados textuais, as consultas aos dados podem ser feitas por eventos ou estruturas e não apenas utilizando-se conectivos lógicos sobre um dicionário preestabelecido.

Alternativas
Comentários
  • Resposta: C. Alguém poderia explicar o que exatamente ele quer dizer com "as consultas aos dados podem ser feitas por eventos ou estruturas" ?

  • Acerta e corre pro abraço, isso que importa!

  • Em bancos de dados textuais, as consultas aos dados podem ser feitas por eventos ou estruturas e não apenas utilizando-se conectivos lógicos sobre um dicionário preestabelecido.

    quer dizer que dados em texto podem ser entendidos pela sua estrutura, maneira de organização e consultados pelos eventos ex A, B, C, pela organização X ou Y, não somente por conectivos lógicos preestabelecido no banco de dados.

    AVANTE


ID
155686
Banca
CESPE / CEBRASPE
Órgão
STJ
Ano
2008
Provas
Disciplina
Banco de Dados
Assuntos

Julgue os próximos itens, que se referem a bancos de dados
textuais.

Em uma operação de consulta a banco de dados textuais, é comum o uso de operadores booleanos AND e OR. A combinação de dados com opções de NOT é restrita em termos de uso porque esse operador, quando utilizado em bancos textuais, não exclui os registros da busca.

Alternativas
Comentários
  • Operadores Booleanos são palavras que informam ao sistema de busca como combinar os termos de sua pesquisa. São eles: AND, OR e NOT e significam, respectivamente, E, OU e NÃO e devem sempre serem digitados em letras maiúsculas para diferenciá-los dos termos pesquisados.

    Exclui sim os registros de busca.

    FONTE:


ID
171307
Banca
FGV
Órgão
MEC
Ano
2009
Provas
Disciplina
Banco de Dados
Assuntos

Um Banco de Dados Textual (BDT) pode ser entendido como uma larga coleção de registros, em que cada registro possui uma lista de palavras de um tamanho qualquer.
Nesse contexto, analise as afirmativas a seguir:

I. A lógica de predicados e a lógica modal de ação podem ser representadas em bancos de dados textuais.

II. Arquivos invertidos com contadores de posição e índices para a próxima palavra são os métodos principais de busca por frases em bancos textuais.

III. Os bancos de dados textuais e os textos neles contidos são a base para a mineração de textos (Text Mining).

Assinale:

Alternativas
Comentários
  • Vejam o artigo: https://disciplinas.dcc.ufba.br/pub/MATA60/SemestreCorrente/Mineracao_de_Dados_e_banco_de_dados_Textuais.pdf

    Especialmente no que se refere a:

    Lógica de Predicados - Na lógica de predicados é possível representar fatos do mundo
    real  como declarações  escritas  em uma  forma de Fórmulas Bem Formadas  (FBEs). Uma
    motivação  importante para o uso da  lógica na  representação do conhecimento deve-se ao
    fato de que ao empregarmos frases lógicas podemos realizar deduções e raciocinar sobre o
    conhecimento.


    Lógica Modal de Ação  - A Lógica Modal de Ação é um aparato  lógico que  tem por
    objetivo representar propriedades dos constituintes de um sistema e como tais propriedades
    são  alteradas  pela  execução  de  uma  ação.  Nela  é  possível  captura  a  noção  de
    seqüenciamento das ações de um texto baseadas nas informações contidas em cada cenário.

  • Já trabalhei com lógica modal e com bancos textuais, e não existe relação NENHUMA entre lógicas modais e bancos textuais... FGV, já viu né...

ID
201394
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Quanto a bancos de dados textuais, julgue os próximos itens.

Um banco de dados textual é uma coleção de documentos, que também pode ser visto como um longo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário.

Alternativas
Comentários
  • Acho que você comentou a questão errada Weverson
  • Uma explicação sobre a questão pode ser vista no TCC de Jadiel de Lima Patrício, do Curso de Ciência da Computação da UNIVALI, que cita Rocha et al.:

    “Rocha et al. (2002) descreve que as informações são armazenadas em um banco de dados que manipule textos e imagens, onde podem ser armazenados e recuperados, por ferramentas que trabalham com indexação de documentos.

    O banco que manipula é o chamado Banco de Dados Textual, que é uma coleção de documentos que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário.

    Este largo registro pode ser comparado ao campo BLOB (Binary Large Object), criado para armazenamento de qualquer tipo de informação.”

    Retirado do Projeto Caveira


ID
201397
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Os dois métodos principais de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os arquivos invertidos com contadores de posição e índices para a próxima palavra.

Alternativas

ID
252112
Banca
CESPE / CEBRASPE
Órgão
STM
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de bancos de dados textuais, julgue o item a seguir.

Bancos de dados textuais auxiliam a tomada de decisão nos níveis gerenciais, uma vez que tratam de dados históricos. Na mineração de dados para um data >warehouse, é necessária a montagem de um banco de dados textual, tal que as pesquisas possam ser realizadas por meio de dados históricos.

Alternativas
Comentários
  • O banco de dados não precisa ser NECESSARIAMENT textual. Pode ser um banco de dados de sons, imagens, vídeos, .... um DW não é necessariamente textual.
  • A questão misturou 2 coisas que são independentes. Datawarehouse são base de dados multidimensionais usadas para apoio a decisão (geralmente através de ferramentas OLAP) .

    Banco de dados textual é um banco de dados especializado em armazenamento e busca de campos texto. Sua estrutura é bem parecida com um banco de dados relacional que usamos normalmente, mas contém adicionalmente uma engine de indexação e busca de textos baseado no idioma definido para o banco.

    Ex.Quando busco questões de concursos, o banco de dados textual já busca pelos termos questão, questao, questoes, questões, questionamento, concurso, concursos. Logo a engine textual já remove as preposições da lingua portuguesa, conjuga os verbos, flexiona palavras e etc.

    Logo, um banco textual não tem nenhum relação com um DW, apenas se este for uma fonte de dados para o DW, o qual passará por um processo de ETL antes de ser dada a carga no DW.

    Espero ter sido claro. Bons estudos a todos.
  • Banco de dados textuais não necessáriamente tratam de dados históricos.
    Não há necessidade de um banco textual para efetuar a mineração de dados.

ID
316354
Banca
FCC
Órgão
TRE-RN
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Em relação a banco de dados textual é correto afirmar:

Alternativas
Comentários
  • Os dois métodos principais de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os arquivos invertidos com contadores de posição e índices para a próxima palavra.

    Fonte:
    http://homepages.dcc.ufmg.br/~nivio/cursos/pa02/seminarios/seminario3/seminario3.html
  • B

     a) ERRADA. 

    Stemming: Stemming é o método para redução de um termo ao seu radical, removendo as desinências, afixos, e vogais temáticas. Com sua utilização, os termos derivados de um mesmo radical serão contabilizados como um único termo.

    c)  Está errado ao afirmar "de forma não indexada".

    d) ERRADA. 

    Stop words é uma lista de termos não representativos para um documento, geralmente essa lista é composta por: preposições, artigos, advérbios, números, pronomes e pontuação.

    e) ERRADA.

    BOW é uma matriz esparsa, onde cada linha representa um documento (Di) e cada coluna representa um termo (Tj).


ID
377623
Banca
FCC
Órgão
TRE-AP
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Em relação à busca de frase em um banco de dados textual, considere:

I. Os métodos de arquivos invertidos são caracterizados por possuírem duas partes principais: vocabulário e listas invertidas, sendo que o vocabulário é uma estrutura de busca que contém todos os diferentes termos existentes no texto de forma desordenada.

II. O arquivo invertido é como uma lista ordenada de palavras-chave. Sendo que por palavra existe um apontador para cada um dos documentos onde ela ocorre e sua posição nesse documento.

III. No método de índices para a próxima palavra, para cada termo distinto do vocabulário é criado uma lista de termos que ocorrem em uma posição posterior no texto, juntamente com apontadores de posição para essas ocorrências.

IV. No método de índices para a próxima palavra, os níveis são implementados como árvores binárias, sendo que as palavras existentes no documento que possuem sucessoras, ficam no primeiro nível e no nível seguinte ao índice para a próxima palavra.

Está correto o que se afirma em:

Alternativas
Comentários

ID
779164
Banca
CESPE / CEBRASPE
Órgão
TRE-RJ
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Com referência a conceitos de banco de dados textual, julgue os
itens seguintes.

Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e descobrir informações em bases textuais escritas em linguagem natural. Com text mining é possível manipular mais facilmente informações não estruturadas, tais como notícias, textos em websites, blogs e documentos em geral.

Alternativas
Comentários
  • Resposta: C

    Refere-se ao processo de obtenção de informação de qualidade a partir de texto em línguas naturais. É inspirado na mineração de dados, que consiste em extrair informação de bancos de dados estruturados; a mineração de texto extrai informação de dados não estruturados ou semi-estruturados.

    Ganhou importância com o crescimento da Internet e dos mecanismos de busca. Com mineração de texto pode-se extrair informação relevante de uma grande base de textos, sem precisar lê-los previamente. Outra utilização seria o auxílio na navegação para encontrar o que se deseja.

    Seguindo a mesma tendência da área de mineração de dados, classificação automática de textos e agrupamento por semelhança são outras funcionalidades comumente utilizadas.

    http://pt.wikipedia.org/wiki/Mineração_de_texto
  • Gab.: CERTO!

    -A mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que os textos representam um tipo específico de dado. (E)

  • A mineração de texto (também conhecida como mineração de dados de

    texto ou descoberta de conhecimento em bancos de dados textuais) é o

    processo semiautomático de extração de padrões (informações úteis e

    conhecimento) de grandes quantidades de fontes de dados não

    estruturadas.

    A mineração de texto é semelhante a mineração de dados, na medida em que

    tem o mesmo propósito e usa os mesmos processos; mas com a mineração de

    texto, a entrada para o processo é uma coleção de arquivos de dados

    não estruturados ou semiestruturados, como documentos do Word,

    arquivos PDF, trechos de texto, arquivos XML e assim por diante.

    Gabarito: Certo.


ID
779167
Banca
CESPE / CEBRASPE
Órgão
TRE-RJ
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Com referência a conceitos de banco de dados textual, julgue os
itens seguintes.

Aplicado ao contexto de pesquisas por frases, um arquivo invertido pode ser visto como uma lista ordenada de palavras-chave que contém, para cada palavra, um apontador para cada um dos documentos em que a palavra ocorre, juntamente com a posição da palavra nesse documento. Esse tipo de índice tem a finalidade de tornar as buscas mais eficientes.

Alternativas
Comentários
  • Resposta: C

    Introdução aos Arquivos Invertidos

    Esta organização é baseada em uma mudança nos papeis de registro e atributos, de tal forma que, em vez de serem coletados os valores dos atributos para cada registro, são identificados os registros que possuem cada um dos particulares valores da chave de acesso considerada. A cada um dos valores da chave de acesso, presentes no arquivo, é associada uma lista de identificações de registros, chamada lista invertidas.

    As técnicas usuais na organização de índices são válidas também para este caso, devendo ser tomado o devido cuidado com o fato de que, em um arquivo invertido, a cada valor da chave de acesso está associado não apenas um endereço do registro, mas sim um conjunto de endereços dos registros que possuem aquele valor da chave.

    O conjunto de listas invertidas associado a uma chave de acesso é chamado inversão, sendo que um arquivo invertido pode assumir uma ou mais inversões. Na figura abaixo, é representado um arquivo invertido com duas inversões associadas à chave secundária IDADE, uma contendo os ENDEREÇOS e outra NÚMEROS.

    Fonte: http://www.ufpa.br/sampaio/curso_de_estdados_2/organizacao_arquivos/organizacao_arquivos.htm#7

  • Lista invertida = índice invertido = arquivoinvertido

    A lista invertida pode ainda conter pesos (como por exemplo, o numero de vezes que o termo aparece no documento)

    Fonte: http://www.di.ufpe.br/~sfd/universo/internet/aula_3.ppt




    Listas invertidas

    Origem: Wikipédia, a enciclopédia livre.

    Em ciência da computaçãoLista Invertida (do inglês inverted list ou inverted index) é uma estrutura de dados que mapeia termos às suas ocorrências em um documento ou conjunto de documentos, armazenados em um banco de dados. É uma estratégia de indexação que permite a realização de buscas precisas e rápidas, em troca de maior dificuldade no ato de inserção e atualização de documentos.

    É a mais popular estratégia de sistemas para obtenção de dados, usada em larga escala em sistemas de gerenciamento de bancos de dados (como o Adabas) e serviços de busca (como o Google).


    Fonte: http://pt.wikipedia.org/wiki/Listas_invertidas


ID
779170
Banca
CESPE / CEBRASPE
Órgão
TRE-RJ
Ano
2012
Provas
Disciplina
Banco de Dados
Assuntos

Com referência a conceitos de banco de dados textual, julgue os
itens seguintes.

O processo de compressão dos arquivos de índices não é adequado para otimização de pesquisas, uma vez que o tempo de descompressão dos dados é muito maior que o tempo de sua recuperação.

Alternativas
Comentários
  • ERRADO


    Diversas técnicas de otimização podem ser empregadas na consulta de frases com arquivos invertidos. Uma otimização importante é a compressão desses arquivos. Como as dimensões de um arquivo invertido (10 a 100% do espaço indexado) o tornam impróprio para uso em memória primária, é uma prática manter os vetores de pesquisa em memória secundária. A redução do tempo de acesso a estes vetores, advinda da redução de ocupação de disco que a compactação propicia, permite ganhos de desempenho significativos.


    Fonte: http://homepages.dcc.ufmg.br/~nivio/cursos/pa02/seminarios/seminario3/seminario3.html



  • Q294998 - CESPE - ANP - 2013

    Para realizar otimização de pesquisas, recomenda-se o uso de compressão dos arquivos de índices, para aumentar o número de listas invertidas presentes no cache da memória, reduzindo o número de acessos ao disco. 

    GABARITO: CORRETO


ID
783763
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

A respeito de portais corporativos, bancos de dados textuais e tipos de dados, julgue o  item  a seguir.


Diferentemente dos bancos de dados relacionais, os textuais não possuem índices para recuperação da informação, haja vista não terem campos específicos. Em vez de índices, esses bancos de dados possuem stopwords, que são palavras-chaves utilizadas como base nas consultas de dados.

Alternativas
Comentários
  • Ano: 2008 Banca: CEBRASPE Órgão: STJ Prova: CESPE - 2008 - STJ - Técnico Judiciário - Informática

    A criação de verbetes de busca é importante para auxiliar e indexar os dados em um banco textual. CERTO

    Ou seja, criar índices e indexar é fundamental em um banco de dados textual.

    ERRADO


ID
804679
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2011
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o item abaixo, relativo a bancos de dados textuais

Em um banco de dados textual com hiperligações, em linguagem natural, os dados são altamente restringidos e suportam alto grau de computação.

Alternativas

ID
1001704
Banca
CESPE / CEBRASPE
Órgão
MPOG
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere às técnicas de recuperação de informações usadas em bancos de dados textuais, julgue os itens que se seguem.

A técnica denominada extração de termos (term extraction) compreende a análise de especialistas no domínio do texto e a incorporação de informações linguísticas às informações estatísticas sobre os termos do documento.

Alternativas
Comentários
  • A extração de termos é um procedimento árduo que requer atenção e cuidado por parte do profissional que o executa. Deve-se, em todas as etapas do processo, adotar uma diretriz que possa ser utilizada por todos os profissionais que forem realizar a extração a fim de que haja uniformização das estratégias utilizadas na extração de termos e para que não se perca dados relevantes. Os termos extraídos devem ser transcritos em uma ficha terminológica para a construção do corpus de análise que deverá ser arquivado para posterior avaliação quanto ao contexto no qual o termo foi extraído e, assim, auxiliar na categorização do mesmo segundo os sete eixos da CIPE®- Versão 1.0. Os dados da ficha terminológica também devem ser utilizados para alimentar uma planilha do a fim de serem excluídas as repetições, o que é realizado com o auxílio do programa.
    Processo de normalização de termos  Após a eliminação das repetições, o próximo passo é submeter os termos a correções de ortografia, análise de sinonímia, adequação de tempos verbais, uniformização de gênero (feminino, masculino) e número (singular, plural) e exclusão de expressões pseudoterminológicas. Na análise dos termos obtidos é comum identificar-se erros de ortografia que precisam ser corrigidos. Um termo digitado erroneamente não é considerado pelo sistema como um termo idêntico ao termo redigido corretamente e, deste modo, o programa não o exclui. Questão: CORRETA


ID
1001707
Banca
CESPE / CEBRASPE
Órgão
MPOG
Ano
2013
Provas
Disciplina
Banco de Dados
Assuntos

No que se refere às técnicas de recuperação de informações usadas em bancos de dados textuais, julgue os itens que se seguem.

De acordo com a fórmula da técnica IDF (inverse document frequence), o termo com maior número de ocorrências em trechos de um texto gera menor índice na fórmula de prioridades, sendo esse termo o mais representativo do documento.

Alternativas
Comentários
  • Errado,

    "Termo com maior número de ocorrências em trechos de um texto gera menor índice" --> maior índice.


ID
1119367
Banca
FGV
Órgão
DPE-RJ
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

O processamento de texto em bancos de dados, mensagens, arquivos ou linguagens de programação, principalmente em ambientes computacionais heterogêneos, implica o uso de padrões para a codificação de caracteres. Entretanto, quando cadeias de caracteres são comparadas ou ordenadas, é preciso estabelecer regras de ordenação, pois em diferentes linguagens e culturas elas podem variar mesmo que as cadeias de caracteres usem a mesma codificação. Essas regras usualmente são referenciadas pelo termo ;

Alternativas
Comentários
  • http://en.wikipedia.org/wiki/Collation

  • ANSI

    American National Standards Institute (literalmente traduz-se como "Instituto Nacional Americano de Padrões"), também conhecido por sua sigla ANSI, é uma organização particular estado-unidense sem fins lucrativos que tem por objetivo facilitar a padronização dos trabalhos de seus membros.

    Fonte:http://pt.wikipedia.org/wiki/American_National_Standards_Institute


    ASCII (American Standard Code for Information Interchange; "Código Padrão Americano para o Intercâmbio de Informação") é um código binário (cadeias de bits: 0s e 1s) que codifica um conjunto de 128 sinais: 96 sinais gráficos (letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 32 sinais de controle. Cada código binário possui 8 bits (equivalente a 1 byte), sendo 7 bits para o propósito de codificação e 1 bit de paridade (detecção de erro).

    Fonte:http://pt.wikipedia.org/wiki/ASCII


    Code priority 

    Código prioritário? Não encontrei referência conceitual.


    Collation
    nada mais é do que a maneira que você armazena e trabalha com os tipos do dados do SQL Server que armazenam Strings. A Collation também interfere na sua aplicação, podendo gerar diversos efeitos como a modificação de instruções enviadas para o SQL Server e a ordem de retorno de informações. ...

    Fonte:http://imasters.com.br/artigo/262/


    Ubiquity (software)

    Ubiquity é um instalador simples de Linux para o Ubuntu e seus derivados. Ele roda pelo LiveCD e tem frontends em Qt e GTK+ . Ubiquity foi introduzido no Ubuntu 6.06 (Dapper Drake).

    Fonte:http://pt.wikipedia.org/wiki/Ubiquity_%28software%29

  • Prezados,

    Collation (Colação) nada mais é que a codificação de caracteres existente no Banco de Dados.
    Quando você realiza a migração do conteúdo de um banco de dados, algumas vezes, pode haver conflitos no collation do banco migrado. 
    O resultado deste conflito é a ausência de caracteres especiais quando informações são consultadas no banco.
    Portanto a alternativa correta é a letra D

  • O termo collation é utilizado para referenciar as regras que determinam os critérios de ordenação dos caracteres. Esses critérios não são universais, então precisa haver um “acordo” entre os sistemas de culturas diferentes que estão trabalhando sobre os mesmos dados para que utilizem a mesma collation.

  • O termo collation é utilizado para referenciar as regras que determinam os critérios de ordenação dos caracteres. Esses critérios não são universais, então precisa haver um “acordo” entre os sistemas de culturas diferentes que estão trabalhando sobre os mesmos dados para que utilizem a mesma collation.


ID
1342159
Banca
FUNCAB
Órgão
MDA
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Entre os métodos principais de busca em bancos de dados textuais, um utiliza indexação de textos, por meio de arquivos invertidos. Um arquivo invertido é um método de busca que tem como características: a estrutura de busca é chamada vocabulário; suporta uma lista invertida que armazena os identificadores dos registros contendo o termo; as consultas são feitas tomando-se a lista invertida correspondente ao termo procurado; as consultas booleanas são feitas obtendo-se a conjunção ou disjunção entre as listas relativas aos termos presentes na consulta.

O método de busca descrito é conhecido como arquivos invertidos com:

Alternativas
Comentários
  • contadores de posição. Acho que nem lendo e relendo os conteúdos todos dá pra gabaritar as questões dessa banca. Muito confuso. Algumas perguntas são tão extensas que quando chegamos nas alternativas já estamos cansados rsss


ID
1342162
Banca
FUNCAB
Órgão
MDA
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

Bancos de dados textuais oferecem várias técnicas de pesquisa direcionadas para consultas de textos livres. Uma delas é representada por uma ferramenta capaz de automaticamente, inovar sinônimos para os argumentos de pesquisa. Assim, o usuário não precisa se lembrar de todos os termos relevantes relacionados à pesquisa.

Exemplo: se uma consulta for feita para a palavra “ automóvel ” , podem ser pesquisados , simultaneamente, os sinônimos “carro” e “veículo”.

Essa técnica é conhecida como:

Alternativas
Comentários
  • Tesauro, também conhecido comdicionário de ideias afins, é uma lista de palavras com significados semelhantes, dentro de um domínio específico de conhecimento

    http://pt.wikipedia.org/wiki/Tesauro


ID
1342165
Banca
FUNCAB
Órgão
MDA
Ano
2014
Provas
Disciplina
Banco de Dados
Assuntos

No contexto da recuperação das informações em bancos de dados textuais, um processo consiste em aplicar operações em uma palavra para encontrar sua raiz gramatical, como, por exemplo: “recuperar” é raiz de “recuperação”, “recuperações”, “recuperam” e “recuperado”. Além de ser útil para encontrar possíveis textos relevantes, esse processo também ajuda a reduzir o tamanho da estrutura de indexação, já que diminui o número de índices distintos e é denominado:

Alternativas
Comentários
  • Stemming

    Uma palavra possui variac~oes sintaticas como plural, gerundio, tempo verbal e etc.

    Ao elaborar uma consulta, o usuario pode especi car uma palavra e, possivelmente, estar

    interessado tambem em ex~oes da mesma.

    Stemming

    e o processo de aplicar operac~oes em uma palavra para encontrar sua raz

    gramatical. Por exemplo, \recuperar" e raiz de \recuperac~ao", \recuperac~oes", \recu-

    peram" e \recuperado". A

  • Gabarito LETRA C - STEMMING


ID
1610428
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Quanto a bancos de dados textuais, julgue o próximo item. 


Um banco de dados textual é uma coleção de documentos, que também pode ser visto como um longo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário. 


Alternativas
Comentários
  • GABARITO: C

    Rocha et al (2002): O banco que manipula é o chamado Banco de Dados Textual, que é uma coleção de documentos que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário. 

  • Uma explicação sobre a questão pode ser vista no TCC de Jadiel de Lima Patrício, do Curso de Ciência da Computação da UNIVALI, que cita Rocha et al.: “Rocha et al. (2002) descreve que as informações são armazenadas em um banco de dados que manipule textos e imagens, onde podem ser armazenados e recuperados, por ferramentas que trabalham com indexação de documentos. O banco que manipula é o chamado Banco de Dados Textual, que é uma coleção de documentos que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário. Este largo registro pode ser comparado ao campo BLOB (Binary Large Object), criado para armazenamento de qualquer tipo de informação.” O TCC pode ser visto aqui: http://siaibib01.univali.br/pdf/Jediael%20Patricio.pdf

  • Gabarito CERTO


ID
1610431
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Quanto a bancos de dados textuais, julgue o próximo item. 


Os dois métodos principais de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os arquivos invertidos com contadores de posição e índices para a próxima palavra. 


Alternativas
Comentários
  • Gabarito CERTO


ID
1610434
Banca
CESPE / CEBRASPE
Órgão
Banco da Amazônia
Ano
2010
Provas
Disciplina
Banco de Dados
Assuntos

Quanto a bancos de dados textuais, julgue o próximo item. 


Encontrar uma informação na Web depende do uso de máquinas de busca e, consequentemente, de sua eficácia. Para permitir a busca por palavras-chaves, frases ou consultas booleanas no conteúdo completo de textos (full text searching), as ferramentas de busca varrem a Web, fazendo o download dos textos e indexando seu conteúdo.


Alternativas
Comentários
  • Gabarito CERTO


ID
1740721
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a banco de dados textuais, julgue o item seguinte.

Arquivo invertido é um mecanismo que utiliza palavras para indexar uma coleção de documentos com a finalidade de facilitar a busca.

Alternativas
Comentários
  • In computer science, an inverted index (also referred to as postings file or inverted file) is an index data structure storing a mapping from content, such as words or numbers, to its locations in a database file, or in a document or a set of documents (named in contrast to a Forward Index, which maps from documents to content). The purpose of an inverted index is to allow fast full text searches, at a cost of increased processing when a document is added to the database. FONTE: https://www.wikiwand.com/en/Inverted_index

  • Na ciência da computação , um índice invertido (também referido como arquivo de postagens ou arquivo invertido ) é uma estrutura de dados índice de armazenar um mapeamento de conteúdo, como palavras ou números , aos seus locais em um arquivo de banco de dados ou em um documento ou um conjunto de documentos (nomeado em contraste com um Índice Adiante , que mapeia a partir de documentos para o conteúdo ) . A finalidade de um índice invertido é permitir rápidas pesquisas de texto completo , a um custo de processamento aumentado quando um documento é adicionado aos databas


ID
1740724
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a banco de dados textuais, julgue o item seguinte.

Arquivo de assinatura é uma estrutura de comprovação de autenticidade do documento perante um certificador digital.

Alternativas
Comentários
  • Achei a questão bem complexa ... 

    Creio que estaria correto se o termo "autenticidade" fosse substituído por "autenticação".

    Para os softwares de assinatura, a Instrução Normativa 09/2006, do ITI, de 18.05.2006, regulamenta os requisitos para softwares de assinatura digital, sigilo e autenticação, no âmbito da ICP-Brasil.


    Fonte: http://www.iti.gov.br/perguntas-frequentes/1743-sobre-certificacao-digital

    []'s

  • No contexto de banco de dados um arquivo de assinatura é uma estrutura de índice para SGBD que suportam avaliação eficiente de consultas booleanas. Um arquivo de assinatura contém um registro de índice para cada documento presente no banco de dados. Esse registro de índice é chamado de assinatura do documento. Por isso, o arquivo de assinatura não tem relação com um certificador digital nesse contexto. 

    FONTE: Sistemas de gerenciamento de banco de dados - 3.ed. : Raghu Ramakrishnan, Johannes Gehrk

  • Gabarito Errado


ID
1740727
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a banco de dados textuais, julgue o item seguinte.

O mecanismo denominado PageRank utiliza metadados semânticos e informações ligadas ao domínio para buscar as características de classificação de componentes de seu conteúdo.

Alternativas
Comentários
  • o PageRank que é o mecanismo de SEO mais conhecido do Google é baseado no número de apontamentos de links. Não utilizando metadados semânticos.

  • Errado.

    PageRank: é um sistema de busca que utiliza a relevância dos links para classificar a ordem a ser mostrada  

  • PageRank = classificação da página (RELACIONADO À RELEVÂNCIA)

    ---

    metadados semânticos = fornecem informações sobre o significado dos dados disponíveis e seus relacionamentos semânticos (RELACIONADO À SIGNIFICAÇÃO)

    (http://www.uel.br/pessoal/ailton/Trabalhos/SemanaAcad-Ailton.html)

  • Essa é o tipo de pergunta q, se vc parar pra pensar um pouquinho, acerta por lógico, mesmo não sabendo nada do assunto.

    Em seguida, vem a pergunta q não quer calar: quem, nos minutos finais e em sã consciência, marcaria uma questão dessas como errada na prova(principalmente com o Nishimura fungando no teu cangote)???

    QUEM???!!!

  • GABARITO ERRADO


ID
1740730
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a banco de dados textuais, julgue o item seguinte.

Stop words integram uma lista universal de palavras utilizadas para identificar as paradas ou finais de textos, de modo a auxiliar na análise semântica.

Alternativas
Comentários
  • Os SGBDT possuem algorítimos capazes de indexar todas as palavras de um documento assim que ele é incluído no banco de dados. Uma lista de palavras cuja indexação não é desejada ou necessária ("stop wods") pode ser definida previamente pelo usuário de sistema. "stop words" são palavras consideradas irrelevantes para pesquisa, como pronomes, artigos e preposições. A não indexação destas palavras evita o uso de recursos desnecessários por parte do gerenciador de banco de dados , o motor do sistema. Técnicas de indexação variam de produto para produto e são importantes para definir sua qualidade.

    http://www.acervosaber.com.br/trabalhos/informatica/banco_de_dados_textual.php

  • Se não me engano, a questão está errada porque as stop words são utilizadas na análise SINTÁTICA, e não na análise SEMÂNTICA.

    Bons estudos!

  • Errado.

    Stopwords: são palavras que podem ser consideradas irrelevantes para o conjunto de resultados a ser exibido em uma busca realizada em uma busca. Ao realizar a busca, as palavras são comparadas com as que estão na lista.

  • Gabarito ERRADO

  • ERRADO

    Não existem stop words universais, elas dependem do contexto, da língua e de outros fatores da linguagem.


ID
1740733
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Com relação a banco de dados textuais, julgue o item seguinte.

O processo de aplicação de operações em uma palavra, a fim de que seja encontrada a etimologia dessa palavra, denomina-se stemming.

Alternativas
Comentários
  • Stemming é o processo de aplicar operações em uma palavra para encontrar sua raíz gramatical. Acho que o gabarito esteja errado.

  • Etimologia (do grego antigo ἐτυμολογία, composto de ἔτυμος "étymos" e -λογία "-logia") é a parte da gramática que trata da história ou origem das palavras.

  • Stemming é o processo de reduzir palavras flexionadas (ou às vezes derivadas) ao seu tronco (stem), base ou raiz,

    Veja as seguintes palavras: pintou, pintaram, pintavam e, claro, "pintada".

    O stem(tronco) dela seria pintar.

    Referencias:

    [1] https://www.computersciencemaster.com.br/2018/12/aula-03-stemming.html

  • processo que consiste em aplicar operações em uma palavra para encontrar sua raiz gramatical, como, por exemplo: “recuperar” é raiz de “recuperação”, “recuperações”, “recuperam” e “recuperado”. Além de ser útil para encontrar possíveis textos relevantes, esse processo também ajuda a reduzir o tamanho da estrutura de indexação, já que diminui o número de índices distintos. outro ex:. menina, menino, reduz para meni/; a ideia é redução de vocábulo e abstração de de significado

  • Gabarito ERRADO


ID
1807267
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o item subsequente, relativo a bancos de dados textuais (BDT).

Recuperação de dados e recuperação de informação são expressões utilizadas para o mesmo processo: retornar para o usuário todos os documentos em que exista o termo pesquisado.

Alternativas
Comentários
  • Recuperação de dados é um termo empregado normalmente na área de segurança quando ocorre alguma falha de tecnologia.

  • Marquei Errado pq dados, informação e conhecimento são coisas diferentes hahahahah


ID
1807270
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o item subsequente, relativo a bancos de dados textuais (BDT).

São técnicas de filtragem utilizadas no BDT: padronização, stopwords e stemming.

Alternativas
Comentários
  • Processamento de linguagem natural

    normalização

    remoção de stopwprds (não não é incluído)

    remoção de numerais

    correção ortográfica

    stemming (padroniza por meio do radical)

    lemming (deixa na forma singular e masculina)

    Gabarito Certo!


ID
1820623
Banca
CESPE / CEBRASPE
Órgão
MEC
Ano
2015
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o item que se segue, no que se refere a bancos de dados textuais.

Vector model é um modelo que pode ser aplicado em pesquisas semânticas como forma de estabelecer a relevância de documentos pesquisados.


Alternativas
Comentários
  • Vector space model or term vector model is an algebraic model for representing text documents (and any objects, in general) as vectors of identifiers, such as, for example, index terms. It is used ininformation filtering, information retrieval, indexing and relevancy rankings. FONTE: https://www.wikiwand.com/en/Vector_space_model

  • Gabarito CERTO


ID
2330143
Banca
CESPE / CEBRASPE
Órgão
SEDF
Ano
2017
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o item a seguir, a respeito de banco de dados, organização de arquivos, métodos de acesso e banco de dados textuais.

Em um texto a ser manipulado por um banco de dados textual, as stopwords são comparadas com uma lista de palavras que depende de cada aplicação.

Alternativas
Comentários
  • Stop words (ou palavras de parada – tradução livre) são palavras que podem ser consideradas irrelevantes para o conjunto de resultados a ser exibido em uma busca realizada em uma search engine.

  • C

    As stopwords, palavras de parada, são palavras que em uma busca podem ser consideradas irrelevantes, como é o caso de os, as, de, etc. Cada aplicação pode possuir seu conjunto característico de stop words.

    Assim, ao ser realizada uma busca textual em um banco de dados, as palavras são comparadas com esta lista stopwords para avaliar se elas devem ser desconsideradas.

  • [1] "Uma stop word é uma palavra muito comum no idioma que está sendo analisado. Muitas vezes são irrelevantes para buscas. As palavras "a", "e", "de", e "em" são consideradas stop words, por isso, costumam ser removidas.

    Os números (1, 2, 3...) são comumente considerados detalhes sem importância para o processamento de texto, mas o propósito da representação é que deve decidir isso. Você pode imaginar contextos onde termos como “4TB” e “1Q13” não teriam sentido, e outros onde poderiam ser modificadores importantes. Por exemplo, as questões do QC são identificadas pelo caractere "Q" e uma sequencia de números (Ex.: Q776712). Aqui eles são relevantes!

    Referências:

    [1] DataScience para Negócios, T Fawcett

  • Gabarito CERTO


ID
2847817
Banca
Quadrix
Órgão
SEDF
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

A respeito dos conceitos e comandos SQL SERVER e DB2 e dos bancos de dados textuais, julgue o item.

É permitido realizar a compactação de um banco de dados textual.

Alternativas
Comentários
  • • Compactação da Informação: Em dimensão reduzida (truncada) a informação permanece compactada uma vez que ocupa menos espaço (eixos) e mantém as características principais do seu conteúdo original.

  • Gabarito Certo

  •  Gabarito: Certo.

    Como funciona um banco de dados Textuais?

    R. São Banco de Dados que armazenam grandes volumes de textos, como livros acadêmicos, literários etc. em formas textuais.

    R. Um dos métodos de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os índices invertidos com contadores de posição.

    R. É permitido realizar a compactação de um banco de dados textual.

    Bons Estudos!


ID
2847820
Banca
Quadrix
Órgão
SEDF
Ano
2018
Provas
Disciplina
Banco de Dados
Assuntos

A respeito dos conceitos e comandos SQL SERVER e DB2 e dos bancos de dados textuais, julgue o item.


Um dos métodos de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os índices invertidos com contadores de posição.

Alternativas
Comentários
  • Um banco de dados textual é uma coleção de documentos, que pode também ser visto como um largo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário. Os dois métodos principais de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os arquivos invertidos com contadores de posição e índices para a próxima palavra. Um arquivo invertido possui duas partes principais: uma estrutura de busca, chamada de vocabulário, contendo todos os termos distintos existentes no texto indexados e, para cada termo, uma lista invertida que armazena os identificadores dos registros contendo o termo. Consultas são feitas tomando-se a lista invertida correspondente ao termo procurado. As consultas booleanas são feitas obtendo-se a conjunção ou disjunção entre as listas relativas ao termos presentes na consulta. Arquivos invertidos podem ser utilizados para busca de frases, através da adição de mais informações a lista invertida. Basicamente, adiciona-se os deslocamentos no texto em que ocorrem as palavras.

    Fonte: https://homepages.dcc.ufmg.br/~nivio/cursos/pa02/seminarios/seminario3/seminario3.html

  • Gabarito CERTO

  • Gabarito: Certo.

    Como funciona um banco de dados Textuais?

    R. São Banco de Dados que armazenam grandes volumes de textos, como livros acadêmicos, literários etc. em formas textuais.

    R. Um dos métodos de busca por frases em bancos de dados textuais de larga escala, utilizando indexação de textos, são os índices invertidos com contadores de posição.

    Bons Estudos!