SóProvas


ID
1340917
Banca
FGV
Órgão
TJ-GO
Ano
2014
Provas
Disciplina
Algoritmos e Estrutura de Dados
Assuntos

Certa cadeia de caracteres (string) não vazia tem comprimento X e contém uma frase em português constituída apenas por letras (acentuadas ou não), dígitos e os sinais comuns de pontuação. Se codificada segundo o padrão ISO-8859-1 (Latin-1), esta cadeia requer X bytes para sua representação; se codificada em UTF-8, são necessários X+1 bytes, ou seja, um byte a mais em relação à representação ISO-8859-1. É correto afirmar que o byte adicional:

Alternativas
Comentários
  • Força Guerreiro!!!!!!

  • Na codificação UTF-8, os caracteres ASCII são todos representados em um só byte. Já os caracteres que não estão presentes na tabela ASCII, como aqueles acentuados ou de outros alfabetos, como hebraico, chinês, cirílico, etc, precisam de mais de um byte para seu armazenamento.

  • A linguagem UTF-8, pelo que eu entendi, tem por base, nas primeiras codificações, o ASCII. Com isso, as variações de caracteres presentes em outros idiomas como alemão, chinês, hebraico etc são representadas em bytes que complementam o ASCII, haja vista que esse é insuficiente pra outros idiomas que não o inglês. Essas complementações podem estar dispostas em "qualquer posição na representação UTF-8", como sugere a resposta letra C, justamente pra sugerir a "presença de caracteres acentuados na cadeia".

    Dando um exemplo sem compromisso, pensemos em um caractere em inglês e um em alemão.

    O caractere em inglês, dentro do UTF-8 vai ser facilmente representado talvez no primeiro byte do código.

    Já o caractere em alemão pode ter 2 byte ou 3 byte. Nisso teriamos um byte talvez até em branco entre o caractere em inglês presente no ASCII e o do alemão que precisou de complementação para se chegar no código desse caractere em específico.

    Não existe rigor na minha exemplificação. Eu não sei a exata codificação de um caractere em alemão no UTF-8, mas estou promovendo esse comentário na tentativa de ajudar a responder a questão, porque não encontrei resposta nos comentários.

    Aliás, abraço pro Kaique, FORÇA GUERREIRO, isso me fez rir muito kkkkkkkkkkkkkkkkkkkkkkk

  • Na codificação UTF-8, os caracteres ASCII são todos representados em um só byte.

    Já os caracteres que não estão presentes na tabela ASCII, como aqueles acentuados ou de outros alfabetos, como hebraico, chinês, cirílico, etc, precisam de mais de um byte para seu armazenamento.

  • eita só comentário de 2021 , FGV voltando rsrsrsrsr