UTF-16究竟是怎么編碼的

大數(shù)據(jù)培訓(xùn),云培訓(xùn),數(shù)據(jù)挖掘培訓(xùn),云計(jì)算培訓(xùn),高端軟件開發(fā)培訓(xùn),項(xiàng)目經(jīng)理培訓(xùn)

1.

首先要注意的是,代理Surrogate是專屬于UTF-16編碼方式的一種機(jī)制,UTF-8和UTF-32是不用代理的。

如前文所述,為了讓UTF-16能繼續(xù)編碼基本平面后面的增補(bǔ)平面中的碼點(diǎn)值,于是擴(kuò)展了UTF-16編碼方式。

具體的擴(kuò)展方法就是為其增加了代理機(jī)制,用兩個(gè)對(duì)應(yīng)于基本平面碼點(diǎn)(即BMP代理區(qū)中的碼點(diǎn))的16位碼元來表示一個(gè)增補(bǔ)平面碼點(diǎn),這兩個(gè)用來表示一個(gè)增補(bǔ)平面碼點(diǎn)的特殊16位碼元就被稱為“代理對(duì)”。

如果要用簡(jiǎn)單的一句話來概括,就是——所有大于0xFFFF的碼點(diǎn)值(即增補(bǔ)平面碼點(diǎn)編號(hào),范圍為0x10000~0x10FFFF,十進(jìn)制為65536~1114111;注意,0xFFFF是十六位二進(jìn)制數(shù)的最大值的十六進(jìn)制表示)要編碼成UTF-16編碼方式的話,就必須使用代理機(jī)制(也就是用代理對(duì)來表示)。

2.

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動(dòng)軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式