關(guān)于GB2312編碼D6DBA3B6對應(yīng)的文字流,gb2312編碼這個(gè)問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧!
1、2.GB2312-80,GBK,GB18030-2000 漢字字符集 其實(shí)解決 JAVA 程序中的漢字編碼問題的方法往往很簡單,但理解其背后的原因,定位問題,還需要了解現(xiàn)有的漢字編碼和編碼轉(zhuǎn)換。
2、 GB2312-80 是在國內(nèi)計(jì)算機(jī)漢字信息技術(shù)發(fā)展初始階段制定的,其中包含了大部分常用的一、二級漢字,和 9 區(qū)的符號。
3、該字符集是幾乎所有的中文系統(tǒng)和國際化的軟件都支持的中文字符集,這也是最基本的中文字符集。
4、其編碼范圍是高位0xa1-0xfe,低位也是 0xa1-0xfe;漢字從 0xb0a1 開始,結(jié)束于 0xf7fe; GBK 是 GB2312-80 的擴(kuò)展,是向上兼容的。
5、它包含了 20902 個(gè)漢字,其編碼范圍是 0x8140-0xfefe,剔除高位 0x80 的字位。
6、其所有字符都可以一對一映射到 Unicode 2.0,也就是說 JAVA 實(shí)際上提供了 GBK 字符集的支持。
7、這是現(xiàn)階段 Windows 和其它一些中文操作系統(tǒng)的缺省字符集,但并不是所有的國際化軟件都支持該字符集,感覺是他們并不完全知道 GBK 是怎么回事。
8、值得注意的是它不是國家標(biāo)準(zhǔn),而只是規(guī)范。
9、隨著 GB18030-2000國標(biāo)的發(fā)布,它將在不久的將來完成它的歷史使命。
10、 GB18030-2000(GBK2K) 在 GBK 的基礎(chǔ)上進(jìn)一步擴(kuò)展了漢字,增加了藏、蒙等少數(shù)民族的字形。
11、GBK2K 從根本上解決了字位不夠,字形不足的問題。
12、它有幾個(gè)特點(diǎn): ●它并沒有確定所有的字形,只是規(guī)定了編碼范圍,留待以后擴(kuò)充。
13、 ●編碼是變長的,其二字節(jié)部分與 GBK 兼容;四字節(jié)部分是擴(kuò)充的字形、字位,其編碼范圍是首字節(jié) 0x81-0xfe、二字節(jié)0x30-0x39、三字節(jié) 0x81-0xfe、四字節(jié)0x30-0x39。
14、 ●它的推廣是分階段的,首先要求實(shí)現(xiàn)的是能夠完全映射到 Unicode 3.0 標(biāo)準(zhǔn)的所有字形。
15、 ●它是國家標(biāo)準(zhǔn),是強(qiáng)制性的。
16、 現(xiàn)在還沒有任何一個(gè)操作系統(tǒng)或軟件實(shí)現(xiàn)了 GBK2K 的支持,這是現(xiàn)階段和將來漢化的工作內(nèi)容。
本文分享完畢,希望對大家有所幫助。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!