计算机数据在计算机中的表示

时间:2022-06-09 阅读:205 评论:0 作者:zhushican

数据计算机中的表示

1、整数的表示

整数用二进制数据的最高位表示符号位,最高位为0表示正整数,最高位为1表示负整数。整数可以用原码反码补码表示。

原码:最高位是符号位,其它位表示数值。

反码:正数的反码与原码相同,负数的反码符号位不变,其它位取反。

补码:正数的补码与原码相同,负数的补码是反码加1。

2、实数的表示

实数,也叫浮点数,转化为e*a*2n的形式后,保存e、a和n即可。其中e为符号(e=1是为正数,e=-1时为负数),a为整数为1的二进制小数,n为整数。

(1)单精度浮点数。用4个字节共32个二进制位存储。第1个二进制位存储符号e(e=1时存储为0,e=-1时存储为1);第2-9个二进制位存储无符号整数127+n,其中n是[-127,128]上的整数;其余二进制位存储a的小数部分。如:十进制实数11.75(10)=1011.11(2)=1.01111*23,这时e=1,a=1.01111,n=3。存储结构为:

↓存储符号   ↓存储a的小数部分

 0 10000010 01111000000000000000000

     ↑存储127+n=130(10)=10000010(2)

计算机数据在计算机中的表示

(2)双精度浮点数。用8个字节共64个二进制位存储。第1个二进制位存储符号e(e=1时存储为0,e=-1时存储为1);第2-12个二进制位存储无符号整数1023+n,其中n是[-1023,1024]上的整数;其余二进制位存储a的小数部分。

3、字符的表示

对于ASCII码字符,使用一个字节,直接存储字符的ASCII码值。

对于汉字,有以下几种常见的汉字字符集编码:

(1)GB2312编码:1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。

(2)BIG5编码:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。

(3)GBK编码:1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。

(4)GB18030编码:2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。

(5)Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。Unicode 编码共有三种,分别为utf-8、utf-16、utf-32,其中utf-8占用一到四个字节,utf-16占用二或四个字节,utf-32占用四个字节。Unicode 码在全球范围的信息交换领域均有广泛的应用


本文链接: http://www.zh-xm.com/post/123.html 转载请注明出处!

评论区 交流一下吧!

共有0条评论来说两句吧...

欢迎 发表评论: