特殊 (Unicode區段)

特殊字符是Unicode的一个简短的区段,分配在基本多文种平面的最末端,位于U+FFF0-FFFF。在这16个码位中,有5个是从Unicode 3.0开始分配的。

  • U+FFF9 行间注解锚,标志着注解文本的开始。
  • U+FFFA 行间注解分隔符,标记注解字符的开始。
  • U+FFFB 行间注解終止符,标志着注解块的结束。
  • U+FFFC  OBJECT REPLACEMENT CHARACTER,在文本中为另一个未指定的对象提供占位符,例如在一个复合文件中。
  • U+FFFD � REPLACEMENT CHARACTER(替换字符),用于替换一个未知的、不被认可的或无法表示的字符。
  • U+FFFE <非字符-FFFE> 不是一个字符。
  • U+FFFF <非字符-FFFF> 不是一个字符。
特殊字符
Specials
範圍U+FFF0..U+FFFF
(16個碼位)
平面基本多文種平面()
文字通用
已分配5個碼位
未分配9個保留碼位
2個非
Unicode版本歷史
1.0.01 (+1)
2.12 (+1)
3.05 (+3)
官方碼表
點擊此處
註釋[1][2]

FFFE和FFFF不是通常意义上的未分配字符,但不是Unicode字符。它们可以用来猜测一个文本的编码方案,因为根据定义,任何包含这些的文本都不是一个正确编码的Unicode文本。Unicode的U+FEFF BYTE ORDER MARK字符可以插在Unicode文本的开头,以表示它的字节性:一个程序在阅读这样的文本并遇到0xFFFE时,就会知道它应该为后面的所有字符转换字节顺序。

它在Unicode 1.0中的区段名是特殊。[3]

特殊字符[1][2][3]
Official Unicode Consortium code chart (PDF)
 0123456789ABCDEF
U+FFFx IAA IAS IAT
注释
1.^ 依据Unicode 15.0
2.^ 灰色区域表示未分配的代码点。
3.^ 黑色区域表示非字符(保证在Unicode标准中永远不会被分配为编码字符的码位)。

歷史

以下Unicode文檔記錄了定義本區塊中特定字符的目的與過程:

版本 最終碼位[lower-alpha 1] 碼位数 L2 ID WG2 ID 文檔
1.0.0 U+FFFD 1 (to be determined)
U+FFFE..FFFF 2 (to be determined)
L2/01-295R Moore, Lisa, , , 2001-11-06
L2/01-355 N2369 (html, doc 页面存档备份,存于) Davis, Mark, , 2001-09-26
L2/02-154 N2403 页面存档备份,存于 Umamaheswaran, V. S., , , 2002-04-22
2.1 U+FFFC 1 UTC/1995-056 Sargent, Murray, , 1995-12-06
UTC/1996-002 Aliprand, Joan; Hart, Edwin; Greenfield, Steve, , , 1996-03-05
N1365 Sargent, Murray, , 1996-03-18
N1353 页面存档备份,存于 Umamaheswaran, V. S.; Ksar, Mike, , , 1996-06-25
L2/97-288 N1603 页面存档备份,存于 Umamaheswaran, V. S., , , 1997-10-24
L2/98-004R N1681 , 1997-12-22
L2/98-070 Aliprand, Joan; Winkler, Arnold, ,
L2/98-318 N1894 页面存档备份,存于 , 1998-10-22
3.0 U+FFF9..FFFB 3 L2/97-255R Aliprand, Joan, , , 1997-12-03
L2/98-055 Freytag, Asmus, , 1998-02-22
L2/98-070 Aliprand, Joan; Winkler, Arnold, ,
L2/98-099 N1727 Freytag, Asmus, , 1998-03-18
L2/98-158 Aliprand, Joan; Winkler, Arnold, , , 1998-05-26
L2/98-286 N1703 页面存档备份,存于 Umamaheswaran, V. S.; Ksar, Mike, , , 1998-07-02
L2/98-270 Hiura, Hideki; Kobayashi, Tatsuo, , 1998-07-29
L2/98-281R (pdf, html 页面存档备份,存于) Aliprand, Joan, , , 1998-07-31
L2/98-363 N1861 页面存档备份,存于 Sato, T. K., , 1998-09-01
L2/98-372 N1884R2 (pdf, doc 页面存档备份,存于) Whistler, Ken; et al, , 1998-09-22
L2/98-416 N1882.zip , 1998-09-23
L2/98-329 N1920 页面存档备份,存于 , 1998-10-28
L2/98-421R Suignard, Michel; Hiura, Hideki, , 1998-12-04
L2/99-010 N1903 (pdf, html 页面存档备份,存于, doc 页面存档备份,存于) Umamaheswaran, V. S., , , 1998-12-30
L2/98-419 (pdf, doc 页面存档备份,存于) Aliprand, Joan, , , 1999-02-05
UTC/1999-021 Duerst, Martin; Bosak, Jon, , 1999-06-08
L2/99-176R Moore, Lisa, , , 1999-11-04
L2/01-301 Whistler, Ken, , , 2001-08-01
  1. 建議的碼位和字符名稱可能與最終的結果不同。

參考資料

  1. . The Unicode Standard. [2016-07-09]. (原始内容存档于2022-09-25).
  2. . The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29).
  3. (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2022-09-30]. (原始内容存档 (PDF)于2016-02-11).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.