Codificação de carateres é um padrão de relacionamento entre um conjunto destes com um conjunto de outra coisa, como por exemplo, números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação. Algumas das formas de representação mais conhecidas são:
- Código ASCII;
- Código Unicode;
- Código Morse;
- EBCDIC (Extended Binary Coded Decimal Interchange Code):
- IBM PC Extended Character;
Código ASCII
ASCII (a sigla para American Standard Code for Information Interchange) é um código binário que codifica um conjunto de sinais. Cada binário possui 8 bits (1 byte), sendo que 7 bits são para o propósito de codificação e o outro bit é de paridade (deteção de erros). O código ASCII serve para representar textos em computadores, equipamentos de comunicação, entre outros. Na tabela ASCII abaixo representada vemos vários códigos e respetivos significados.
Código Unicode
Código Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. O padrão consiste em cerca de 107 000 carateres (um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição, ordenação alfabética e renderização). Ou seja, o código Unicode define uma correspondência entre símbolos e números, só que utiliza códigos de valor bem maiores. Na tabela abaixo, vemos um exemplo de correspondência utilizando o código Unicode
Sem comentários:
Enviar um comentário