SóProvas


ID
4863964
Banca
CESPE / CEBRASPE
Órgão
Ministério da Economia
Ano
2020
Provas
Disciplina
Banco de Dados
Assuntos

Julgue o seguinte item, a respeito de big data.


A mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que os textos representam um tipo específico de dado.

Alternativas
Comentários
  •  Mineração de textos, também conhecido como mineração de dados textuais ou descoberta de conhecimento de bases de dados textuais, em geral, se refere ao processo de extração de informações de interesse e padrões não-triviais ou descoberta de conhecimento em documentos de texto não-estruturados. Pode ser visto como uma extensão da mineração de dados. A mineração de texto segue, em última instância, o mesmo conjunto de etapas da mineração de dados e utiliza-se de um conjunto de técnicas comuns.

    Gabarito: ERRADO

    Fonte: Prof. Thiago Cavalcanti

    Estratégia

  • Mineração de dados é um conjunto, enquanto mineração de texto é um subconjunto.

  • Tanto a Mineração de Texto quanto a Mineração de Dados são processos semi-automatizados e buscam por padrões úteis e desconhecidos. 

    A diferença está na natureza dos dados analisados: enquanto os dados estruturados encontram-se em tabelas de bancos de dados, os dados não-estruturados apresentam-se em forma de documentos de Word, arquivos PDF, fragmentos de texto, arquivos XML, etc.

    Ou seja, para realizar Mineração de Texto, primeiro é preciso estruturar os dados e depois extrair os insights.

  • Falta a resposta do concurseiro quase nada, aquele manja de informática TI.

  • sao semelhantes ..

    obs:A mineração de textos representam um tipo específico de processamento e nao de dados

  • Mineração de dados (gênero)

    Mineração de textos (espécie)

  • A mineração de texto segue o mesmo conjunto de etapas da mineração de dados e utiliza-se de um conjunto de técnicas comuns.

    Gabarito: ERRADO

    Fonte: Prof. Thiago Cavalcanti

  • Primeiramente, desculpe-me por fornecer uma fonte e informações em inglês, mas acho que esse link ajuda a explicar o que a colega Amanda comentou. Verde = data mining e Vermelho = text mining

    While data mining handles structured data – highly formatted data such as in databases or ERP systems – text mining deals with unstructured textual data – text that is not pre-defined or organized in any way such as in social media feeds.

    On one hand, data mining combines disciplines including statistics, artificial intelligence and machine learning to apply directly to structured data.

    On the other hand, text mining requires an extra step while maintaining the same analytic goal as data mining. Text mining deals with unstructured data so, before any data modeling or pattern recognition function can be applied, the unstructured data has to be organized and structured in a way that allows for data modeling and analytics to occur

    Em resumo dessa ópera: no text mining, a gente ainda precisa cuidar dos nossos "queridos" dados para depois obter os padrões úteis, mas isso não quer dizer que data mining e text mining usam técnicas diferentes

    Fonte: https://blogs.opentext.com/whats-the-difference-between-data-mining-and-text-mining/

  • Mineração de texto: é uma área promissora que permite categorizar informações e encontrar relações entre documentos textuais não conectados. Identificação de palavras chave e de concorrência de termos em artigos da mesma área e análise de sentimentos em redes sociais são aplicações interessantes. 

    CESPE 2014 - É possível realizar mineração de dados em documentos textuais como, por exemplo, uma página da Internet.

  • Mineração de Textos é diferente de um mecanismo de busca. Na busca o usuário já sabe o que quer encontrar. A tecnologia usada em mineração de textos ajuda o usuário a descobrir informações desconhecidas. 

    Mineração de Textos é diferente de análise de constituintes, pois não é necessário formalizar toda a construção sintática do texto. 

    Mineração de Textos é diferente de chatterbot (robôs de conversação), pois não se pretende simular o comportamento humano. 

    Mineração de Textos não é mineração de dados, pois trabalha com textos, mas utiliza técnicas semelhantes às de mineração de dados.

  • gabarito errado

    >> Em tese o que muda não são as técnicas, mas sim os tipos de dados que são utilizados, que normalmente quando se fala em texto são dados não estruturados.

  • ✅Gabarito(Errado)

    A mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que os textos representam um tipo específico de dado.

    Quando se utiliza o termo "técnicas diferentes" utiliza-se do pressuposto que a MT não utiliza nenhuma técnica utilizada pela MD. Isso é totalmente equivocado, visto que a MT utiliza não de todas as técnicas da MD, mas de algumas.

    ✓ "MT não é mineração de dados, pois trabalha com textos, porém utiliza algoritmos de mineração de dados além de outros convenientes."

    Tem muitas outras fontes!

    Fonte:

    A Tecnologia de Mineração de Textos (Artigo tutorial)

    Christian Aranha, Emmanuel Passos

    Lab.ICA Elétrica PUC-Rio

  • Gabarito = Errado

    Tanto a Mineração de Texto quanto a Mineração de Dados são processos semi-automatizados e buscam por padrões úteis e desconhecidos. 

    A diferença está na natureza dos dados analisados: enquanto os dados estruturados encontram-se em tabelas de bancos de dados, os dados não-estruturados apresentam-se em forma de documentos de Word, arquivos PDF, fragmentos de texto, arquivos XML, etc.

    Ou seja, para realizar Mineração de Texto, primeiro é preciso estruturar os dados e depois extrair os insights.

    .Fonte : https://hupdata.com/mineracao-de-texto-o-que-e-como-aplicar/

    . Tentei ser mais didático possível, se encontrarem algum erro, não hesitem e mandem mensagem/ corrijam/ reportem abuso ... algo do tipo.

     

     

    "E, tudo o que pedirdes em oração, crendo, o recebereis."

     

    Mateus 21:22

  • Resposta errada!

    Bom fui pelo básico, pois não sou da área de TI:

    "Em palavras simples, a mineração de dados é definida como um processo usado para extrair dados utilizáveis ​​de um conjunto maior de dados brutos. Isso implica na análise de padrões de dados em grandes lotes usando um ou mais softwares."

    Fonte: https://www.infonova.com.br/negocios/mineracao-de-dados-para-que-serve-como-fazer/

    "Com respeito à inserção de dados em um software computacional, as variáveis em uma base de dados são classificadas tipicamente como numéricas (N), texto (T) ou data (D). Como exemplos de variáveis numéricas temos idade, renda, saldo da fatura, número de dependentes, etc. O sexo, estado civil, nome, rua, CEP, CIC, status do cliente são exemplos de variáveis alfanuméricas. A data de vencimento da conta e a data de nascimento são exemplos de variáveis do tipo data."

    Fonte: https://www.ime.unicamp.br/~hildete/dados.pdf

    Assim, a Mineração de Dados é utilizada para números, textos ou datas, não utilizando a Mineração de Texto técnicas diferentes da Mineração de Dados. A Mineração de Texto faz parte da Mineração de Dados.

  • GABARITO ERRADO

    Mineração de texto (Text mining): encontra padrões úteis em textos para descobrir informações desconhecidas, geralmente em dados não estruturados. As técnicas utilizadas são as mesmas da mineração de dados.

    FONTE: Estratégia Concursos, meus resumos.

    "Se não puder se destacar pelo talento, vença pelo esforço"

  • ERRADO

    Mineração de texto, conhecida também como mineração de dados textuais e semelhante à análise textual, refere-se ao processo de obtenção de informações importantes de um texto. Informações importantes são obtidas normalmente pela elaboração de padrões e tendências através de meios como o padrão estatístico de aprendizagem.

    Geralmente a mineração de texto envolve o processo de estruturação do texto de entrada (frequentemente análise, junto com a adição de algumas características linguísticas derivadas e com a retirada de outras, e com a subsequente inserção em um banco de dados), de derivação de padrões dentro da estrutura de dados e, por fim, de avaliação e interpretação do resultado.

  • Errado

    - Mineração de Textos é diferente de um mecanismo de busca. Na busca o usuário já sabe o que quer encontrar. A tecnologia usada em mineração de textos ajuda o usuário a descobrir informações desconhecidas. 

    - Mineração de Textos é diferente de análise de constituintes, pois não é necessário formalizar toda a construção sintática do texto. 

    - Mineração de Textos é diferente de chatterbot (robôs de conversação), pois não se pretende simular o comportamento humano. 

    - Mineração de Textos não é mineração de dados, pois trabalha com textos, mas utiliza técnicas semelhantes às de mineração de dados.

  • Bem, nem fui atrás de fonte externa. Apenas pesquei os melhores comentários e fiz um compilado. Pessoal mandou bem!!!

    Como bem citou a camarada Helemn, "Mineração de textos se refere ao processo de extração de informações em documentos de texto não-estruturados. Pode ser visto como uma extensão da mineração de dados".  

    Imagine uma empresa chamada "Negocios Enrolados", tipo essa: https://www.youtube.com/watch?v=ek3emOHAVXo

    Obs: Assista ao video q vc vai entender melhor...rdss

    Ela têm informações em banco de dados(em tabelinhas bonitinhas, ou seja, estruturada), mas tbm têm uma porca**iada toda, com documentos *.doc em unidades de rede, arquivos *.txt em computadores locais...repare q enquanto os primeiros são organizados em relações com linhas e colunas bem definidas, os ultimos, ou seja, *.doc e *.txt não têm qqr oganização, sem linhas, colunas, erros de portugues, enfim, uma bagun**ça generalizada...estes são chamados de dados não estruturados.

    Vc consegue aplicar técnicas de mineracao no primeiro caso tranquilamente, mas não consegue no segundo caso(no máximo, vai confundir seu algoritmo a ponto e fazer análises completamente noia**das).

    Vc tem q, primeiro, limpar e transformar estes ultimos em um formato q a maquina, a "mineradora", consiga fazer o seu trabalho(Ou seja, como disse a Amanda, para realizar Mineração de Texto, primeiro é preciso estruturar os dados e depois extrair os insights).

    Assim, a diferença está na natureza dos dados analisados: enquanto os dados estruturados encontram-se em tabelas de bancos de dados, os dados não-estruturados apresentam-se em forma de documentos de Word, arquivos PDF, fragmentos de texto, arquivos XML, etc.

    Por fim, digo q houve, para essa questao, muitos comentarios, mas a maioria são excelentes. Quanto ao camarada ali q reclamou do excesso de comentários, eu não fico p**uto com excessos de comentarios...eu fico infeza**do de raiva com comentários est**upidos ou repetitivos, ou, ainda, com comentários em q o camarada, q não se dá ao trab de fazer o minimo de pesquisa, fala um monte de m**erda induzindo os outros a erros. Dá tanta rai*va q tenho q tomar calman**tes tarja* preta* pra não sur**tar.

    Fonte:

    [1] Aqui mesmo!!!

  • Muda dos dados

  • - Mineração de Texto: é um meio para encontrar padrões interessantes/úteis em um contexto de informações textuais não estruturadas, combinado com alguma tecnologia de extração e de recuperação da informação, processo de linguagem natural e de sumarização ou indexação de documentos. A internet está cheia de informações e processá-las pode ser uma tarefa e tanto, mas essa tarefa pode ser facilmente executada por meio de Ferramentas de Mineração de Texto. Este processo envolve um grau de dificuldade significativo considerando que as informações normalmente estão disponíveis em linguagem natural, sem a preocupação com a padronização ou com a estruturação dos dados – sua matéria prima é a palavra!

  • "mineração de texto segue o mesmo conjunto de etapas da mineração de dados"

  • ERRADO.

    - Mineração de Textos não é mineração de dados!! Porque trabalha com textos, porém utiliza técnicas semelhantes às de mineração de dados...

    #Gran

  • Mineração de texto é uma área promissora que permite categorizar informações e encontrar relações entre documentos textuais não conectados. Identificação de palavras chave e de coocorrência de termos em artigos da mesma área e análise de sentimentos em redes sociais são aplicações interessantes.

    Direção Concursos

  • "Essa questão deixou muita gente com a “pulga atrás da orelha”, vou te explicar.

    A mineração de dados, dentro do processo de descoberta do conhecimento KDD, é uma etapa, porém em forma de subprocesso, pois existem várias etapas dentro do processo de mineração e isso pode ser visto no próprio CRISP-DM.

    Neste processo de KDD, os dados podem ser obtidos de diversa fontes, sejam estruturadas ou não estruturadas.

    No caso dos textos, estes são categorizados como não estruturados, do ponto de vista de dados. Durante as etapas de seleção e pré-processamento do KDD, os dados, sejam eles estruturados ou não estruturados, passam por uma formatação adequada para utilização das técnicas de mineração de dados sobre eles. A partir desta etapa de mineração, as técnicas de mineração existentes podem ser usadas, onde não há exclusividade de aplicação de técnicas em mineração de textos, uma vez que estes textos já sofreram adequação nas sua formatação para serem utilizados juntamente com os demais dados que são estruturados, ou seja, os dados estão em uma estrutura comum.

    A questão erra ao afirmar que neste caso serão utilizadas técnicas diferentes de mineração de dados para mineração de textos."

    Comentada por professor.

  • Outra questão que ajuda a entender:

    (CESPE) Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e descobrir informações em bases textuais escritas em linguagem natural. Com text mining é possível manipular mais facilmente informações não estruturadas, tais como notícias, textos em websites, blogs e documentos em geral. (C)

    Logo, algumas técnicas de mineração de dados e mineração de texto são semelhantes sim.

    GAB E

  • A mineração de texto é um tipo de mineração de dados, então não dá pra dizer que as técnicas são diferentes. Claro que algumas abordagens para se realizar o pré-processamento de dados são um pouco mais específicas e aplicáveis a dados textuais, mas no final das contas também se utiliza técnicas como classificação, clusterização e regras de associação para minerar texto. Item errado.

  • Mineração de dados é um conjunto, enquanto mineração de texto é um subconjunto.

    Mineração de textos, também conhecido como mineração de dados textuais ou descoberta de conhecimento de bases de dados textuais, em geral, se refere ao processo de extração de informações de interesse e padrões não-triviais ou descoberta de conhecimento em documentos de texto não-estruturados. Pode ser visto como uma extensão da mineração de dados. A mineração de texto segue, em última instância, o mesmo conjunto de etapas da mineração de dados e utiliza-se de um conjunto de técnicas comuns.

    Gabarito: ERRADO

  • Gabarito: ERRADO

      A mineração de texto segue o mesmo conjunto de etapas da mineração de dados e utiliza-se de um conjunto de técnicas comuns.

    Fonte: Prof. Thiago Cavalcanti

  • ERRADO

    MINERAÇÃO DE TEXTO (text mining)

    • utiliza-se das mesmas técnicas -> NÃO HÁ ESSA DISTINÇÃO QUE A QUESTÃO MENCIONA
    • processo semi-automático para extração de conhecimento de dados não estruturados.

    Enquanto na Mineração de dados os dados se encontram estruturados no banco. - Na Mineração de texto os dados dos documentos Word, PDF, XML se encontram Não estruturados, e precisam ser minerados para extrair dados estruturados.

  • ERRADO !

    A técnica de text mining faz uso do mesmo conjunto de etapas da mineração de dados.

  • MINERAÇÃO DE TEXTO (text mining)

    • utiliza-se das mesmas técnicas -> NÃO HÁ ESSA DISTINÇÃO QUE A QUESTÃO MENCIONA
    • processo semi-automático para extração de conhecimento de dados não estruturados.

    Enquanto na Mineração de dados os dados se encontram estruturados no banco. - Na Mineração de texto os dados dos documentos Word, PDF, XML se encontram Não estruturados, e precisam ser minerados para extrair dados estruturados.

  • A mineração de textos utiliza das mesmas técnicas da mineração de dados.

  • Discordo parcialmente do gabarito. Talvez as técnicas de mineração podem ser as mesmas, mas algumas técnicas de pré-processamento são mais específicas para mineração de texto: Bag of words, remoção de stopwords, TF-IDF, Stemming são alguns exemplos.

    Pra quem quiser um exemplo mais prático de como essas técnicas são usadas, pesquisem essa dissertação:

    "Aplicação de técnicas de mineração de textos para classificação de documentos : um estudo da automatização da triagem de denúncias na CGU"