HTML汉字编码标准介绍

  发布时间:2021-11-27 22:39:22   作者:佚名   我要评论
这篇文章主要介绍了HTML汉字编码标准介绍,需要的朋友可以参考下
(福利推荐:【腾讯云】服务器最新限时优惠活动,云服务器1核2G仅99元/年、2核4G仅768元/3年,立即抢购>>>:9i0i.cn/qcloud

(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

HTML中需要指定网页所使用的编码,一般指定的方式为:

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

而在新版本HTML5中,也可以使用更简单的方式:

<meta charset="UTF-8">

因为世界上所用的语言文字很多,为了满足跨语言、跨平台进行文本转换、处理的要求,国际组织研制了Unicode编码,于1994年正式公布,并不断升级,提供了1,114,112个码点,定义了包括古文字符号在内的人类所有可读字符的字符集。但Unicode编码为了表示那么多字符,通常使用32位(即4个字节)来表示一个字符,需要占用比较大的存储空间,对常用的字符(如ASCII)也需要较长的编码,内存使用效率比较低。

为此,定义了一种使用8位编码单元的变宽的编码格式UTF-8。UTF-8编码中,一些常用的字符可以使用较少的字节来表示,而较少使用的字符则使用较多的字节,提高了编码占用空间的效率。如ASCII码仍使用一个字节来表示,这是通过识别编码中一些高位的来实现的,它搭建了ASCII编码和Unicode的桥梁。具体编码方式为:
·0000~007F:0xxxxxxx,存储为一个字节,有7位可表示不同的字符,一般对应ASCII字符
·0080~07FF:110xxxxx,10xxxxxx,存储为两个字节,有11位可表示不同的字符
·0800~FFFF:1110xxxx,10xxxxxx,10xxxxxx,存储为3个字节,有16位用来表示不同的字符
·10000~1FFFFF:11110xxx,10xxxxxx,10xxxxxx,10xxxxxx,存储为4个字节,有21位表示不同的字符
可以看到规律:如果最高位不是0,那么数字中在0前面的数字表示一个序列包括的码元数。一个序列中,第一个码元之后的所有码元都有10前缀。Unicode编码还有UTF-16、UTF-32等其他的编码格式,但UTF-8更采用,同样也可以表示所有的编码集。

过去在计算机中表示汉字最常用的是GB2312编码,1980年发布,全称为《信息交换用汉字编码字符集--基本集》,它使用两个字节来表示一个汉字,共收入6763个汉字和682个非汉字图形字符,兼容于ASCII字符集。但这种编码中包含的汉字比较少,不能表示港台使用的繁体字,一些非常用字及古书中的字也无法表示,实用中会感到很多不便。后来,在GB2312基础上进行了扩展,也就是GBK编码标准,可以表示繁体字及一些异体字,使用范围得到扩展。

为了适合更广范围的应用,又发布了GB18030编码标准,GB18030-2000收录了27533个汉字,GB18030-2005则收录了70244个汉字,并包含了藏、蒙古、傣、彝、朝鲜、维吾尔文等多种少数民族文字。GB18030的总编码空间超过150万个码位,编码采用单字节、双字节和四字节对字符编码,单字节部分采用GB/T11383的编码结构与规则,使用0x00至0x7F码位,对应于ASCII码的相应码位;双字节部分,首字节码位从0x81至0xFE,尾字节码位分别是0x40至0x7E和0x80至0xFE;四字节部分采用GB/T11383未采用的0x30到0x39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0x81308130到0xFE39FE39。GB18030编码还在不断扩充中。

为了更多地表示汉字及一些特殊符号,也为了未来更好地兼容性,新制作的网页最好使用GB18030标准,也就是使用下面两种方式之一指定编码:

<meta http-equiv="Content-Type" content="text/html;charset=gb18030">
<meta charset="gb18030">

当然,为了显示外国文字方便,也可以使用国际通用的UTF-8编码。

相关文章

  • HTML汉字编码标准介绍

    这篇文章主要介绍了HTML汉字编码标准介绍,需要的朋友可以参考下
    2021-11-27
  • HTML基础详解(下)

    本文主要介绍了HTML基础知识,HTML指的是超文本标记语言,它不是一种编程语言,而是一种标记语言。需要具体了解HTML的小伙伴可以参考一下这篇文章哦
    2021-10-13
  • HTML基础详解(上)

    本文主要介绍了HTML基础知识,HTML指的是超文本标记语言,它不是一种编程语言,而是一种标记语言。需要具体了解HTML的小伙伴可以参考一下这篇文章哦
    2021-10-13
  • 关于HTML编码导致的乱码问题

    今天遇到个问题就是写的HTML代码打开显示的是乱码问题,怎么处理这一问题呢,下面小编通过图文实例相结合给大家分享处理方法,一起看看吧
    2021-09-02
  • 纯html+css实现Element loading效果

    本文主要介绍了纯html+css实现Element loading效果,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-29
  • 纯html+css实现奥运五环的示例代码

    正好最近在开奥运会,今天就用html+css实现奥运五环,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-27
  • HTML+CSS实现导航条下拉菜单的示例代码

    菜单栏在很多地方都可以用到,尤其是带下拉的菜单栏,本文主要介绍了HTML+CSS实现导航条下拉菜单,具有一定的参考价值,感兴趣的可以了解一下
    2021-07-27
  • html+css实现滚动到元素位置显示加载动画效果

    这篇文章主要介绍了html+css实现滚动到元素位置显示加载动画效果,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下
    2021-07-27
  • 纯html+css实现打字效果

    本文主要介绍了纯html+css实现打字效果,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-26
  • html+css实现环绕倒影加载特效

    本文主要介绍了html+css实现环绕倒影加载特效,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-07-06

最新评论

?


http://www.vxiaotou.com