Padrões de codificação de carateres

Dentro da temática da multimédia, o Texto surge como o meio dominante para a apresentação de informação baseada em computador. Para esta apresentação são usados vários padrões de codificação de carateres, que permitem, através da relação de carateres (como grafemas que constituem o sistema alfabeto) com um conjunto de números ou de pulsos elétricos, por exemplo.

Padrões de codificação de caracteres retratam o relacionamento entre um conjunto de caracteres com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e a sua transmissão através de redes de telecomunicação. Exemplos comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse.

Código ASCII

ASCII (American Standard Code for Information Interchange) é o Código Padrão Americano para o Intercâmbio de Informação. Trata-se de um código binário que codifica um conjunto de 128 sinais: 96 sinais gráficos (letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 32 sinais de controlo. Cada código binário possui 8 bits (=1 byte ): 7 bits para o propósito de codificação e 1 bit de paridade (detecção de erro).
A codificação ASCII é usada para representar textos em computadores, equipamentos de comunicação, entre outros dispositivos. Desenvolvida a partir de 1960, grande parte das codificações de caracteres modernas a herdaram como base. Os sinais não-imprimíveis, conhecidos como caracteres de controlo, são amplamente utilizados em dispositivos de comunicação e afetam o processamento do texto.


Código Unicode

Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard 1, 2 o padrão consiste de pouco mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição e ordenação alfabética.

Comentários

Mensagens populares