最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
当前位置: 首页 - 科技 - 知识百科 - 正文

解读HTML:命名空间与字符编码

来源:懂视网 责编:小采 时间:2020-11-27 15:37:08
文档

解读HTML:命名空间与字符编码

解读HTML:命名空间与字符编码:在做项目的过程中,我们经常会建立各种各样的规范,以方便团队之间更好的合作更好的完成项目;同样我们也经常会听到各种各样的协议,比如Google的IM软件Gtalk使用的开放的XMPP协议,只要其他IM软件也遵循XMPP协议就能与Gtalk使用互通;而互联网上的信息无以计
推荐度:
导读解读HTML:命名空间与字符编码:在做项目的过程中,我们经常会建立各种各样的规范,以方便团队之间更好的合作更好的完成项目;同样我们也经常会听到各种各样的协议,比如Google的IM软件Gtalk使用的开放的XMPP协议,只要其他IM软件也遵循XMPP协议就能与Gtalk使用互通;而互联网上的信息无以计

在做项目的过程中,我们经常会建立各种各样的规范,以方便团队之间更好的合作更好的完成项目;同样我们也经常会听到各种各样的协议,比如Google的IM软件Gtalk使用的开放的XMPP协议,只要其他IM软件也遵循XMPP协议就能与Gtalk使用互通;而互联网上的信息无以计数,这些信息本身是独立存在的,如何将其串联并呈现在用户眼前,就需要使用到HTTP协议。

同样的道理,因为浏览器们各自的内核不同,对于默认样式的渲染也不尽相同,所以就需要一份各浏览器都遵循的规则来保证同一个网页文档在不同浏览器上呈现出来的样式是一致的,这个规则就是DOCTYPE声明。

因为互联网是互通的,所以任意的两个或者以上的网页文档都可能会涉及到数据交换,而因为xml语言是允许用户自定义标签的,所以任意两个交换的文档就可能会出现相同的标签,从而导致相同标签的冲突,所以就需要一个命名空间以区分开交换文档中可能存在的相同标签。

XHTML做为HTML向XML过渡的一种语言,并不能实现XML语言中的用户自定义标签,所以XHMTL文档中的命名空间都是相同的:

xmlns即是XHTML namespace的缩写,也就是所谓的“命名空间”。与DOCTYPE声明一样,xmlns也属于一种声明。与HTML文档中仍然存在DOCTYPE声明不一样的是,在HTML文档是不存在xmlns的,我们平常所见到的xmlns都是出现在XHTML文档中的。

在制作一个网页的时候,除了在开始的时候声明DOCTYPE(文档类型)之外,如果是XHTML文档还需要声明命名空间,而第三个需要声明的就是网页文档的字符编码类型:

为了能被浏览器正确的解释以及通过W3C验证,每个XHTML文档都应该声明所使用的字符编码。很多时候网页文档出现乱码大部分都是由于字符编码不对而引起的。

utf-8是unicode的一种变长度的编码表达方式,做为一种全球通用型的字符编码正越来越多的网页文档所使用,使用utf-8字符编码的网页可最大程度的避免不同区域的用户访问相同网页时因字符编码不同而导致的乱码现象。

但是当我们打开国内的大多数网站看,特别是门户型的大型网站,关于字符编码的声明却并非是utf-8,而是gb2312:

当然,除了gb2312外还有一些网站使用gbk或者是gb18030编码,这三种字符编码都是属于简体中文字符集。也就是说,如果一台电脑没有安装简体中文字符集时,当它访问字符编码为gb2312的中文网页时,则显示出来的是乱码。

既然使用gb2312字符编码时会因为不同区域的用户访问而可能出现乱码现象,那为何不使用utf-8呢?

其中一个原因可能历史遗留的原因,而另一个更重要的原因应该是由于两种编码的存储方式不同而造成的文档体积不同。

使用gb2312字符编码集时,一个汉字是占用2个字节的大小,而一个汉字在utf-8编码中所占的字节数却往往都是在3个字节,甚至是3个以上的字节。所以对于同一个中文文档来说,使用gb2312字符编码来进行存储的体积是要小于utf-8编码所存储的文档大小的。

而对于文字多访问量大的中文网站来说,使用gb2312编码的网页文档在下载传输上可以节省下不小的流量,再者是因为中文网站的用户群体基本上都锁定在中文用户上,这些也就是很多网站使用gb2312编码而不是utf-8编码的原因。

但是文字多访问量大的网站,国内并不多,再加上可能成对的乱码问题,所以在制作网页的时候推荐使用utf-8编码。

当然,不管用何种编码,最重要的是整站使用的编码要统一。

对于字符编码的声明除了上面的方式,还可能看到另一种声明方式:

这种声明方式是针对老版本的浏览器的,在浏览器已经普遍更新换代的今天已经不推荐使用这种声明方式。

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文档

解读HTML:命名空间与字符编码

解读HTML:命名空间与字符编码:在做项目的过程中,我们经常会建立各种各样的规范,以方便团队之间更好的合作更好的完成项目;同样我们也经常会听到各种各样的协议,比如Google的IM软件Gtalk使用的开放的XMPP协议,只要其他IM软件也遵循XMPP协议就能与Gtalk使用互通;而互联网上的信息无以计
推荐度:
标签: 代码 命名 html
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top