2023-10-31 bigbai
1、字符表:要显示的字符的集合,例如所有的英文字符、所有的汉字,字符编码:字符表中的字符对应的二进制表示。
2、字符集:定义了一种规则,将一串二进制数字解释为一个字符。是计算机科学领域里的一项业界标准。它对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更为简单的方式来呈现和处理文字。目前已经编码了12万+的字符。
3、——维基百科。简单来说,就是给世界上存在的字符都赋予唯一的二进制编码。直接做字符集的问题。
4、因为要编码所有可能的字符,那么每个字符占用的字节长度就会变多。以英文为例,一个英文字符使用码只需要一个字节,而用需要4个字节。并且前面的字节都是0。
5、这样纯英文文件的存储大小就会成倍扩大,是极大的浪费。一种变长的编码方式,基于的一种实现。它使用1–4个字节表示一个字符,根据不同的字符变化字节的长度,可以节省空间。编码规则如下:。
1、对于单字节的字符,字节的第一位设为0,后面7位是这个字符的码。码表中的字符,-8编码与其码保持一致。对于个字节的字符,>1,第一个字节的前位都设为1,第+1位设为0,后面字节的前两位均设为10。剩余的二进制位,从后向前填上这个符号的码。
2、用0填充未使用的二进制位。根据上表可以看出,-8剩余可以填的位数,决定了对应编码的范围。
3、下面举个转换的例子:。“樊”的是60,查表可知,60属于第三行的范围,因此”樊”的-8编码需要三个字节,即格式是11101010。
4、然后,从60的最后一个二进制位开始,从后向前填入格式中的,多出的位补0。最终,”樊”的-8编码是。由此可以总结出字符用-8编码的规律:。
5、4个字节的-8十六进制编码一定是以开头。3个字节的-8十六进制编码一定是以开头。2个字节的-8十六进制编码一定是以或开头。
原文链接:https://www.bigbai.cc/news/7106.html
本文版权:如无特别标注,本站文章均为原创。