最近常見有人對GB、GBK、GB18030、Unicode等編碼概念不清,再摻雜上Ext-A、Ext-B、Ext-C等,更混亂了。所以特別整理一些知識貼出來給大家: GB、BIG5、GBK、GB18030、Unicode GB2312:早期的,為了處理漢字,程序員設計了用于簡體中文的GB2312,即國家標準字集,中華人民共和國國家標準漢字信息交換用編碼,是一個由中華人民共和國國家標準總局發布的關于簡化漢字的編碼,通行于中國大陸地區及新加坡,簡稱GB碼或國標碼。共定義6763個漢字和682個其它符號。 BIG5字集:臺灣繁體字集,共包括國標繁體漢字13053個。 GBK (俗稱大字符集):該編碼標準共收錄漢字21003個、符號883個,并提供1894個造字碼位,簡、繁體字融于一庫。如果你的輸入法有什么常用的人名等打不出,就可以試試使用GBK字庫。 GB18030:國家制定的一個強制性大字集標準,全稱為GB18030-2000,凡在中國大陸銷售的國內外中文電腦,都必須能夠處理27533個漢字,否則將不準銷售。它的推出使我國港臺地區及其他國家使用的漢字集有了一個"大一統"的標準。 Unicode :也是一種字符編碼方法,不過它是由國際組織設計,可以容納全世界所有語言文字的編碼方案。Unicode的學名是"Universal Multiple-Octet Coded Character Set",簡稱為UCS。可輸出國際超大字集全部70000多個中日韓漢字及20000多個不同種類的字母與符號(需安裝超大字集支持包) 所以從漢字包含來看,簡單地可以說: |