文本 (Unicode)

Unicode中,一种文本()是字母和其他书面符号的一个集合,用于在一个或多个书写系统()中表示文本信息。[1]有些文本只支持一种书写系统和语言,例如亚美尼亚语。其他文本支持许多不同的书写系统:例如,拉丁文本支持英语法语德语意大利语越南语拉丁语本身以及其他多种语言。一些语言有多种可选的书写系统,因而也就使用多种文本:例如,在土耳其语中,阿拉伯文本在20世纪之前使用,但在20世纪初过渡到拉丁文本。有关每种文本支持的语言列表,请参阅按文本列出的语言列表符号和Unicode控制字符某种程度上与文本互补。

统一化后的变音字符标点字符经常具有“通用”或“继承”的文本属性。然而,独立的文本往往有自己的标点变音符号,以至于许多文本不仅包含字母,还包含变音符号等标记、标点、数字,甚至还有自己的特殊符号和空格字符。

Unicode 15.0定义了161种独立的文本,包括94种现代文本和67种古代或历史文本。[2][3]更多的文本正在编码过程中,有的已被临时分配予计划中的编码。[4]

定义和分类

当多种语言使用相同的文本时,经常会出现一些差异,特别是在变音符号和其他标记方面。例如,瑞典语和英语都使用拉丁文本。但是,瑞典语包括字符å(有时称为瑞典语的O),而英语没有这样的字符。英语也没有使用变音符号“组合用上圆圈”来表示任何字符。通常,共享相同文本的语言共享许多相同的字符。尽管瑞典语和英语书写系统存在这些外围差异,但它们被认为使用同一种拉丁文本。因而,Unicode对文本的抽象是一种基本的组织手段。不同字母或书写系统之间的差异仍然存在,并通过Unicode灵活的文本、组合标记和校对算法得到支持。

文本与书写系统

书写系统有时被视为文本的同义词。但是,它也可以指一种文本所支持的具体的具体书写系统。例如,拉丁文本支持越南语书写系统。一个书写系统也可能涵盖多种文本;例如,日本的书写系统使用汉字平假名片假名

大多数书写系统可以大致分为几类:象形()、音节()、字母(,亦称)、元音附标()、辅音音素()和特征();然而,这些分类的所有特征都可能以不同的比例出现在任何给定的书写系统中,这导致通常很难对一个系统进行纯粹的分类。术语复杂系统有时用于分类有困难的混合系统。

Unicode通过其众多的文本支持所有这些类型的书写系统。Unicode还为字符添加了更多属性,以帮助区分各种字符以及它们在Unicode文本处理算法中的行为方式。

特殊文本属性值

除了显式或特定的文本属性外,Unicode还使用三个特殊值:[5]

通用
Unicode只能将通用字符集中的一个字符分配给一种文本。但是,许多字符(不属于正式的自然语言书写系统的一部分,或在许多书写系统中统一的字符)可能用于多种文本(例如货币符号、规约符号、数字和标点符号)。在这些情况下,Unicode将它们定义为属于“通用”文本(ISO 15924代码Zyyy)。
继承
许多变音符号和非间距组合字符可以应用于来自多种文本的字符。在这些情况下,Unicode 将它们分配给“继承”文本(ISO 15924 代码Zinh),这意味着它们属于与它们所组合的主要字符相同的文本类型,因此在不同的上下文中它们可能被视为属于不同的文本。例如,U+0308  ̈  COMBINING DIAERESIS(组合用分音符)既可以与U+0065 e LATIN SMALL LETTER E(小写拉丁字母E)组合为拉丁字母ë,也可以与U+0435 е CYRILLIC SMALL LETTER IE(小写西里尔字母IE)组合为西里尔字母ё。在前一个例子中,它继承了主要字符的拉丁文本属性,而在后一个例子中继承了西里尔文本属性。
未知
“未知”文本值(ISO 15924 代码Zzzz)被赋予未分配的、私用的、非字符的以及代理用的码点。

文本中的字符类别

Unicode为每个字符提供了一个通用的类别属性。所以每个字符除了属于一种文本之外,还从属于一个类别。通常的文本由字母字符组成,包括:大写字母、小写字母和修饰字母。一些字符被认为是一些预组的连字的标题字母,例如Dz(U+01F2)。此类标题连字均采用拉丁语和希腊语文本,并且都是兼容字符,因此Unicode不鼓励使用它们。将来不太可能添加新的标题字母。

大多数书写系统不区分大小写字母。对于这些文本,所有字母都归类为“其他字母”或“修饰字母”。中日韩统一表意文本等表意文本也被归类为“其他字母”。然而,一些文本确实区分了大写和小写:拉丁文本、西里尔文本、希腊文本、亚美尼亚文本、格鲁吉亚文本和沙漠文本,但即使对于这些文本,也有一些字母既不是大写也不是小写。

文本还可以包含任何其他一般类别字符,例如标记(变音符号和其他)、数字(数字)、标点符号分隔符(单词分隔符,例如空格)、符号和非图形格式字符。当它们仅被特定文本使用时,它们会包含在特定文本中,否则通常会被统一化并包含在标点符号或变音符号区块中。但是,任何文本(除了“通用”和“继承:文本)中的大部分字符都是字母。

Unicode中的文本列表

Unicode根据 ISO 15924列表定义了一百多个文本名称(称为“别名”或“属性值别名”)。Unicode对ISO 15924的Zyyy(未确定文本的代码)使用“通用”名称,对ISO 15924的Zinh(继承文本的代码)使用“继承”,对ISO 15924的Zzzz(未编码文本的代码)使用“未知”。此外,ISO 15924文本代码Zsym(符号)和Zmth(数学符号)未被使用,它们不被认为是Unicode意义上的文本。

ISO 15924文本代码[a][b]Unicode[c][d]
ISO 15924 Unicode收录的文本[e]
代码 No. ISO 15924
名称
中文名称 别名[f] 方向 版本 字符数 备注
Adlm 166 Adlam 富拉语文本 Adlam 从右至左书写 编辑维基数据9.088
Afak 439 Afaka 阿法卡音节文本 从左至右 编辑维基数据未被Unicode收录, proposal under review by the Unicode Technical Committee[6][7]
Aghb 239 Caucasian Albanian 高加索阿尔巴尼亚文 Caucasian Albanian 从左至右 编辑维基数据7.053古代/历史文本
Ahom 338 Ahom, Tai Ahom 阿洪姆文 Ahom 从左至右 编辑维基数据8.058古代/历史文本
Arab 160 Arabic 阿拉伯文 Arabic 从右至左书写 编辑维基数据1.01,281
Aran 161 Arabic (Nastaliq variant) 波斯体阿拉伯文 从右至左书写 编辑维基数据Typographic variant of Arabic
Armi 124 Imperial Aramaic 阿拉米字母 Imperial Aramaic 从右至左书写 编辑维基数据5.231古代/历史文本
Armn 230 Armenian 亚美尼亚字母 Armenian 从左至右 编辑维基数据1.095
Avst 134 Avestan 阿维斯陀字母 Avestan 从右至左书写 编辑维基数据5.261古代/历史文本
Bali 360 Balinese 峇里字母 Balinese 从左至右 编辑维基数据5.0121
Bamu 435 Bamum 巴姆穆文本 Bamum 从左至右 编辑维基数据5.2657
Bass 259 Bassa Vah 巴萨文 Bassa Vah 从左至右 编辑维基数据7.036古代/历史文本
Batk 365 Batak 巴塔克文 Batak 从左至右 编辑维基数据6.056
Beng 325 Bengali (Bangla) 孟加拉文 Bengali 从左至右 编辑维基数据1.096
Bhks 334 Bhaiksuki 拜克舒基文 Bhaiksuki 从左至右 编辑维基数据9.097古代/历史文本
Blis 550 Blissymbols 布力辛博文 从左至右 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Bopo 285 Bopomofo 注音符号 Bopomofo 从左至右、从右至左书写 编辑维基数据1.072
Brah 300 Brahmi 婆罗米文 Brahmi 从左至右 编辑维基数据6.0109古代/历史文本
Brai 570 Braille 点字 Braille 从左至右 编辑维基数据3.0256
Bugi 367 Buginese 布吉文 Buginese 从左至右 编辑维基数据4.130
Buhd 372 Buhid 布希德文 Buhid 从左至右 编辑维基数据3.220
Cakm 349 Chakma 查克马文 Chakma 从左至右 编辑维基数据6.170
Cans 440 Unified Canadian Aboriginal Syllabics 加拿大原住民音节文本 Canadian Aboriginal 从左至右 编辑维基数据3.0710
Cari 201 Carian 卡里亚字母 Carian 从左至右、从右至左书写 编辑维基数据5.149古代/历史文本
Cham 358 Cham 占文 Cham 从左至右 编辑维基数据5.183
Cher 445 Cherokee 切罗基文 Cherokee 从左至右 编辑维基数据3.0172
Chrs 109 Chorasmian 花剌子模文 Chorasmian 从右至左书写、从上至下 编辑维基数据未被Unicode收录
Cirt 291 Cirth 克尔斯文 从左至右 编辑维基数据未被Unicode收录
Copt 204 Coptic 科普特字母 Coptic 从左至右 编辑维基数据1.0137古代/历史文本, Disunified from Greek in 4.1
Cpmn 402 Cypro-Minoan 塞浦路斯-米诺斯文本 Cypro Minoan 从左至右 编辑维基数据未被Unicode收录
Cprt 403 Cypriot syllabary 赛普勒斯音节文本 Cypriot 从右至左书写 编辑维基数据4.055古代/历史文本
Cyrl 220 Cyrillic 西里尔字母 Cyrillic 从左至右 编辑维基数据1.0443
Cyrs 221 Cyrillic (Old Church Slavonic variant) 早期西里尔字母 从左至右 编辑维基数据古代/历史文本, typographic variant of Cyrillic
Deva 315 Devanagari (Nagari) 天城文 Devanagari 从左至右 编辑维基数据1.0154
Diak 342 Dives Akuru 迪维希阿库鲁文 Dives Akuru 从左至右 编辑维基数据未被Unicode收录
Dogr 328 Dogra 多格拉文 Dogra 从左至右 编辑维基数据11.060古代/历史文本
Dsrt 250 Deseret (Mormon) 德瑟雷特字母 Deseret 从左至右 编辑维基数据3.180
Dupl 755 Duployan shorthand, Duployan stenography 杜普雷速记 Duployan 从左至右 编辑维基数据7.0143
Egyd 070 Egyptian demotic 世俗体 双向文稿 编辑维基数据未被Unicode收录
Egyh 060 Egyptian hieratic 僧侣体 未被Unicode收录
Egyp 050 Egyptian hieroglyphs 圣书体 Egyptian Hieroglyphs 从右至左书写、从左至右 编辑维基数据5.21,080古代/历史文本
Elba 226 Elbasan 爱尔巴桑字母 Elbasan 从左至右 编辑维基数据7.040古代/历史文本
Elym 128 Elymaic 埃利迈文 Elymaic 从右至左书写 编辑维基数据12.023古代/历史文本
Ethi 430 Ethiopic (Geʻez) 吉兹字母 Ethiopic 从左至右 编辑维基数据3.0495
Geok 241 Khutsuri (Asomtavruli and Nuskhuri) 格鲁吉亚文小草体 Georgian 从左至右 编辑维基数据Unicode groups Geok and Geor together as "Georgian"
Geor 240 Georgian (Mkhedruli and Mtavruli) 格鲁吉亚文骑士体 Georgian 从左至右 编辑维基数据1.0173For Unicode, see also Geok
Glag 225 Glagolitic 格拉哥里字母 Glagolitic 从左至右 编辑维基数据4.1132古代/历史文本
Gong 312 Gunjala Gondi 贡贾拉贡德文本 Gunjala Gondi 从左至右 编辑维基数据11.063
Gonm 313 Masaram Gondi 马萨拉姆贡德文本 Masaram Gondi 从左至右 编辑维基数据10.075
Goth 206 Gothic 哥德字母 Gothic 从左至右 编辑维基数据3.127古代/历史文本
Gran 343 Grantha 古兰塔文 Grantha 从左至右 编辑维基数据7.085古代/历史文本
Grek 200 Greek 希腊字母 Greek 从左至右 编辑维基数据1.0518Sometimes expressed as boustrophedon (mirroring of alternate lines rather than purely left-to-right)
Gujr 320 Gujarati 古吉拉特文 Gujarati 从左至右 编辑维基数据1.091
Guru 310 Gurmukhi 古木基文 Gurmukhi 从左至右 编辑维基数据1.080
Hanb 503 Han with Bopomofo (alias for Han + Bopomofo) 汉字(带注音符号) 直书从右至左、从左至右 编辑维基数据See Hani, Bopo
Hang 286 Hangul (Hangŭl, Hangeul) 谚文 Hangul 从左至右、直书从右至左 编辑维基数据1.011,739Hangul syllables relocated in 2.0
Hani 500 Han (Hanzi, Kanji, Hanja) 汉字(中文汉字、日本汉字、韩国汉字) Han 从左至右、从上至下 编辑维基数据1.089,233
Hano 371 Hanunoo (Hanunóo) 哈努诺字母 Hanunoo 从左至右、从下至上 编辑维基数据3.221
Hans 501 Han (Simplified variant) 简体中文 从左至右 编辑维基数据Subset Hani
Hant 502 Han (Traditional variant) 繁体中文 从左至右 编辑维基数据Subset Hani
Hatr 127 Hatran 哈特拉文 Hatran 从右至左书写 编辑维基数据8.026古代/历史文本
Hebr 125 Hebrew 希伯来文 Hebrew 从右至左书写 编辑维基数据1.0134
Hira 410 Hiragana 平假名 Hiragana 直书从右至左、从左至右 编辑维基数据1.0379
Hluw 080 Anatolian Hieroglyphs (Luwian Hieroglyphs, Hittite Hieroglyphs) 安纳托利亚象形文本 Anatolian Hieroglyphs 从左至右 编辑维基数据8.0583古代/历史文本
Hmng 450 Pahawh Hmong 救世苗文 Pahawh Hmong 从左至右 编辑维基数据7.0127
Hmnp 451 Nyiakeng Puachue Hmong 创世纪苗文 Nyiakeng Puachue Hmong 从左至右 编辑维基数据12.071
Hrkt 412 Japanese syllabaries (alias for Hiragana + Katakana) 假名 Katakana or Hiragana 直书从右至左、从左至右 编辑维基数据See Hira, Kana
Hung 176 Old Hungarian (Hungarian Runic) 古匈牙利字母 Old Hungarian 从右至左书写 编辑维基数据8.0108古代/历史文本
Inds 610 Indus (Harappan) 印度河文本 从右至左书写牛耕式转行书写法 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Ital 210 Old Italic (Etruscan, Oscan, etc.) 古意大利字母 Old Italic 从右至左书写、从左至右 编辑维基数据3.139古代/历史文本
Jamo 284 Jamo (alias for Jamo subset of Hangul) 韩语字母 Subset Hang
Java 361 Javanese 爪哇字母 Javanese 从左至右 编辑维基数据5.290
Jpan 413 Japanese (alias for Han + Hiragana + Katakana) 日文文本 直书从右至左、从左至右 编辑维基数据See Hani, Hira and Kana
Jurc 510 Jurchen 女真文 从左至右 编辑维基数据未被Unicode收录
Kali 357 Kayah Li 克耶里字母 Kayah Li 从左至右 编辑维基数据5.147
Kana 411 Katakana 片假名 Katakana 直书从右至左、从左至右 编辑维基数据1.0304
Khar 305 Kharoshthi 佉卢文 Kharoshthi 从右至左书写 编辑维基数据4.168古代/历史文本
Khmr 355 Khmer 高棉文 Khmer 从左至右 编辑维基数据3.0146
Khoj 322 Khojki 可吉文 Khojki 从左至右 编辑维基数据7.062古代/历史文本
Kitl 505 Khitan large script 契丹大字 从左至右 编辑维基数据未被Unicode收录
Kits 288 Khitan small script 契丹小字 Khitan Small Script 直书从右至左 编辑维基数据
Knda 345 Kannada 卡纳达文 Kannada 从左至右 编辑维基数据1.089
Kore 287 Korean (alias for Hangul + Han) 韩汉混用文 从上至下、从左至右、从右至左书写 编辑维基数据See Hani and Hang
Kpel 436 Kpelle 克培列文 从左至右 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Kthi 317 Kaithi 凯提文 Kaithi 从左至右 编辑维基数据5.267古代/历史文本
Lana 351 Tai Tham (Lanna) 老傣文 Tai Tham 从左至右 编辑维基数据5.2127
Laoo 356 Lao 寮文 Lao 从左至右 编辑维基数据1.082
Latf 217 Latin (Fraktur variant) 德文尖角体 从左至右 编辑维基数据Typographic variant of Latin
Latg 216 Latin (Gaelic variant) 盖尔体 从左至右 编辑维基数据Typographic variant of Latin
Latn 215 Latin 拉丁字母 Latin 从左至右 编辑维基数据1.01,366See Latin script in Unicode
Leke 364 Leke 勒克文 从左至右 编辑维基数据未被Unicode收录
Lepc 335 Lepcha (Róng) 绒巴文 Lepcha 从左至右 编辑维基数据5.174
Limb 336 Limbu 林布文 Limbu 从左至右 编辑维基数据4.068
Lina 400 Linear A 线形文本A Linear A 从左至右 编辑维基数据7.0341古代/历史文本
Linb 401 Linear B 线形文本B Linear B 从左至右 编辑维基数据4.0211古代/历史文本
Lisu 399 Lisu (Fraser) 老傈僳文 Lisu 从左至右 编辑维基数据5.248
Loma 437 Loma 洛玛文 从左至右 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Lyci 202 Lycian 吕基亚字母 Lycian 从左至右 编辑维基数据5.129古代/历史文本
Lydi 116 Lydian 吕底亚字母 Lydian 从右至左书写 编辑维基数据5.127古代/历史文本
Mahj 314 Mahajani 马哈佳尼文 Mahajani 从左至右 编辑维基数据7.039古代/历史文本
Maka 366 Makasar 望加锡文 Makasar 从左至右 编辑维基数据11.025古代/历史文本
Mand 140 Mandaic, Mandaean 曼达安字母 Mandaic 从右至左书写 编辑维基数据6.029
Mani 139 Manichaean 摩尼字母 Manichaean 从右至左书写 编辑维基数据7.051古代/历史文本
Marc 332 Marchen 象雄文 Marchen 从左至右 编辑维基数据9.068古代/历史文本
Maya 090 Mayan hieroglyphs 玛雅文本 未被Unicode收录
Medf 265 Medefaidrin (Oberi Okaime, Oberi Ɔkaimɛ) 梅德法伊德林文 Medefaidrin 从左至右 编辑维基数据11.091
Mend 438 Mende Kikakui 门德基卡库文 Mende Kikakui 从右至左书写 编辑维基数据7.0213
Merc 101 Meroitic Cursive 麦罗埃文草书体 Meroitic Cursive 从右至左书写 编辑维基数据6.190古代/历史文本
Mero 100 Meroitic Hieroglyphs 麦罗埃文圣书体 Meroitic Hieroglyphs 从右至左书写 编辑维基数据6.132古代/历史文本
Mlym 347 Malayalam 马拉雅拉姆文 Malayalam 从左至右 编辑维基数据1.0117
Modi 324 Modi, Moḍī 莫迪文 Modi 从左至右 编辑维基数据7.079古代/历史文本
Mong 145 Mongolian 蒙古文 Mongolian 从左至右垂直、从左至右 编辑维基数据3.0167Includes Clear, Manchu scripts
Moon 218 Moon (Moon code, Moon script, Moon type) 穆恩字母 从左至右 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Mroo 264 Mro, Mru 默禄文 Mro 从左至右 编辑维基数据7.043
Mtei 337 Meitei Mayek (Meithei, Meetei) 梅泰文 Meetei Mayek 从左至右 编辑维基数据5.279
Mult 323 Multani 穆尔塔尼文 Multani 从左至右 编辑维基数据8.038古代/历史文本
Mymr 350 Myanmar (Burmese) 缅文 Myanmar 从左至右 编辑维基数据3.0223
Nand 311 Nandinagari 南迪城文 Nandinagari 从左至右 编辑维基数据12.065古代/历史文本
Narb 106 Old North Arabian (Ancient North Arabian) 古北阿拉伯字母 Old North Arabian 从右至左书写 编辑维基数据7.032古代/历史文本
Nbat 159 Nabataean 纳巴泰字母 Nabataean 从右至左书写 编辑维基数据7.040古代/历史文本
Newa 333 Newa, Newar, Newari, Nepāla lipi 普拉卡利特文 Newa 从左至右 编辑维基数据9.094
Nkdb 085 Naxi Dongba (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba) 东巴文 从左至右 编辑维基数据未被Unicode收录
Nkgb 420 Nakhi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba) 哥巴文 从左至右 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Nkoo 165 NKo, N'Ko 西非书面文本 NKo 从右至左书写 编辑维基数据5.062
Nshu 499 Nüshu 女书 Nushu 直书从右至左 编辑维基数据10.0397
Ogam 212 Ogham 欧甘字母 Ogham 从下至上、从左至右 编辑维基数据3.029古代/历史文本
Olck 261 Ol Chiki (Ol Cemet', Ol, Santali) 桑塔利文 Ol Chiki 从左至右 编辑维基数据5.148
Orkh 175 Old Turkic, Orkhon Runic 古突厥文 Old Turkic 从右至左书写 编辑维基数据5.273古代/历史文本
Orya 327 Oriya (Odia) 奥里亚文 Oriya 从左至右 编辑维基数据1.090
Osge 219 Osage 欧塞奇字母 Osage 从左至右 编辑维基数据9.072
Osma 260 Osmanya 奥斯曼亚字母 Osmanya 从左至右 编辑维基数据4.040
Palm 126 Palmyrene 帕尔迈拉字母 Palmyrene 从右至左书写 编辑维基数据7.032古代/历史文本
Pauc 263 Pau Cin Hau 包钦豪文 Pau Cin Hau 从左至右 编辑维基数据7.057
Perm 227 Old Permic 古彼尔姆文 Old Permic 从左至右 编辑维基数据7.043古代/历史文本
Phag 331 Phags-pa 八思巴字 Phags-pa 从左至右垂直 编辑维基数据5.056古代/历史文本
Phli 131 Inscriptional Pahlavi 碑刻巴列维文 Inscriptional Pahlavi 从右至左书写 编辑维基数据5.227古代/历史文本
Phlp 132 Psalter Pahlavi 诗篇巴列维文 Psalter Pahlavi 从右至左书写 编辑维基数据7.029古代/历史文本
Phlv 133 Book Pahlavi 书本巴列维文 从右至左书写 编辑维基数据未被Unicode收录
Phnx 115 Phoenician 音标 Phoenician 从右至左书写 编辑维基数据5.029古代/历史文本
Piqd 293 Klingon (KLI pIqaD) 克林贡文 从左至右 编辑维基数据Rejected for inclusion in the Unicode Standard[8][9]
Plrd 282 Miao (Pollard) 柏格理苗文 Miao 从左至右 编辑维基数据6.1149
Prti 130 Inscriptional Parthian 碑刻帕提亚文 Inscriptional Parthian 从右至左书写 编辑维基数据5.230古代/历史文本
Qaaa 900 Reserved for private use (start) 私人使用区(开始) 未被Unicode收录
Qaai908(Private use)(私人用途) 未被Unicode收录 (Before version 5.2, this was used instead of Zinh)
Qabx 949 Reserved for private use (end) 私人使用区(结束) 未被Unicode收录
Rjng 363 Rejang (Redjang, Kaganga) 勒姜字母 Rejang 从左至右 编辑维基数据5.137
Rohg 167 Hanifi Rohingya 哈乃斐罗兴亚文本 Hanifi Rohingya 从右至左书写 编辑维基数据11.050
Roro 620 Rongorongo 朗格朗格 牛耕式转行书写法 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Runr 211 Runic 卢恩字母 Runic 从左至右、牛耕式转行书写法 编辑维基数据3.086古代/历史文本
Samr 123 Samaritan 撒玛利亚字母 Samaritan 从右至左书写、从上至下 编辑维基数据5.261
Sara 292 Sarati 沙拉堤文本 从上至下、从左至右、从右至左书写牛耕式转行书写法、从左至右垂直 编辑维基数据未被Unicode收录
Sarb 105 Old South Arabian 古南阿拉伯字母 Old South Arabian 从右至左书写 编辑维基数据5.232古代/历史文本
Saur 344 Saurashtra 索拉什特拉文 Saurashtra 从左至右 编辑维基数据5.182
Sgnw 095 SignWriting 手语书写符号 SignWriting 从左至右垂直 编辑维基数据8.0672
Shaw 281 Shavian (Shaw) 萧伯纳字母 Shavian 从左至右 编辑维基数据4.048
Shrd 319 Sharada, Śāradā 夏拉达文 Sharada 从左至右 编辑维基数据6.194
Shui 530 Shuishu 水书 直书从右至左 编辑维基数据未被Unicode收录
Sidd 302 Siddham, Siddhaṃ, Siddhamātṛkā 悉昙文本 Siddham 从左至右 编辑维基数据7.092古代/历史文本
Sind 318 Khudawadi, Sindhi 库达巴蒂文 Khudawadi 从左至右 编辑维基数据7.069
Sinh 348 Sinhala 僧伽罗文 Sinhala 从左至右 编辑维基数据3.0110
Sogd 141 Sogdian 粟特字母 Sogdian 纵书与横书、从上至下 编辑维基数据11.042古代/历史文本
Sogo 142 Old Sogdian 粟特字母 Old Sogdian 从右至左书写 编辑维基数据11.040古代/历史文本
Sora 398 Sora Sompeng 索拉僧平字母 Sora Sompeng 从左至右 编辑维基数据6.135
Soyo 329 Soyombo 索永布文本 Soyombo 从左至右 编辑维基数据10.083古代/历史文本
Sund 362 Sundanese 巽他字母 Sundanese 从左至右 编辑维基数据5.172
Sylo 316 Syloti Nagri 锡尔赫特城文 Syloti Nagri 从左至右 编辑维基数据4.144
Syrc 135 Syriac 叙利亚字母 Syriac 从右至左书写 编辑维基数据3.088
Syre 138 Syriac (Estrangelo variant) 叙利亚字母古典体 从右至左书写 编辑维基数据叙利亚字母的印刷变体
Syrj 137 Syriac (Western variant) 叙利亚字母西部变体 从右至左书写 编辑维基数据叙利亚字母的印刷变体
Syrn 136 Syriac (Eastern variant) 叙利亚字母东部变体 从右至左书写 编辑维基数据叙利亚字母的印刷变体
Tagb 373 Tagbanwa 塔格巴努亚文 Tagbanwa 从左至右 编辑维基数据3.218
Takr 321 Takri, Ṭākrī, Ṭāṅkrī 塔克里文 Takri 从左至右 编辑维基数据6.167
Tale 353 Tai Le 傣仂文 Tai Le 从左至右 编辑维基数据4.035
Talu 354 New Tai Lue 新傣仂文 New Tai Lue 从左至右 编辑维基数据4.183
Taml 346 Tamil 泰米尔文 Tamil 从左至右 编辑维基数据1.0123
Tang 520 Tangut 西夏文 Tangut 直书从右至左、从左至右 编辑维基数据9.06,892古代/历史文本
Tavt 359 Tai Viet 傣担文 Tai Viet 从左至右 编辑维基数据5.272
Telu 340 Telugu 泰卢固文 Telugu 从左至右 编辑维基数据1.098
Teng 290 Tengwar 滕格瓦字母 从左至右 编辑维基数据未被Unicode收录
Tfng 120 Tifinagh (Berber) 提非纳文 Tifinagh 从左至右、从右至左书写、从上至下、从下至上 编辑维基数据4.159
Tglg 370 Tagalog (Baybayin, Alibata) 贝贝因文 Tagalog 从左至右 编辑维基数据3.220
Thaa 170 Thaana 它拿字母 Thaana 从右至左书写 编辑维基数据3.050
Thai 352 Thai 泰文 Thai 从左至右 编辑维基数据1.086
Tibt 330 Tibetan 藏文 Tibetan 从左至右 编辑维基数据2.0207Added in 1.0, removed in 1.1 and reintroduced in 2.0
Tirh 326 Tirhuta 底罗仆多文 Tirhuta 从左至右 编辑维基数据14.082
Tasa 书写系统 14.089
Toto 294 书写系统 Toto 从左至右 编辑维基数据14.031
Ugar 040 Ugaritic 乌加里特字母 Ugaritic 从左至右 编辑维基数据4.031古代/历史文本
Vaii 470 Vai 瓦伊文 Vai 从左至右 编辑维基数据5.1300
Visp 280 Visible Speech 可视语言 从左至右 编辑维基数据未被Unicode收录
Wara 262 Warang Citi (Varang Kshiti) 瓦兰齐地文 Warang Citi 从左至右 编辑维基数据7.084
Wcho 283 Wancho 文乔字母 Wancho 从左至右 编辑维基数据12.059
Wole 480 Woleai 沃莱艾文 从左至右 编辑维基数据未被Unicode收录, proposal in initial/exploratory stage[6]
Xpeo 030 Old Persian 古波斯楔形文本 Old Persian 从左至右 编辑维基数据4.150古代/历史文本
Xsux 020 Cuneiform, Sumero-Akkadian 楔形文本 Cuneiform 从左至右 编辑维基数据5.01,234古代/历史文本
Yezi 192 Yezidi 雅兹迪文 Yezidi 从右至左书写 编辑维基数据未被Unicode收录
Yiii 460 Yi 彝文 Yi 从左至右 编辑维基数据3.01,220
Zanb 339 Zanabazar Square (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, Horizontal Square Script) 札那巴札尔方形字母 Zanabazar Square 从左至右 编辑维基数据10.072古代/历史文本
Zinh 994 Code for inherited script 继承文本 Inherited 10.0571
Zmth 995 Mathematical notation 数学符号 Not a 'script' in Unicode
Zsym 996 Symbols 符号 Not a 'script' in Unicode
Zsye 993 Symbols (emoji variant) 颜文本 Not a 'script' in Unicode
Zxxx 997 Code for unwritten documents 不成文 Not a 'script' in Unicode
Zyyy 998 Code for undetermined script 未定 Common 7,805
Zzzz 999 Code for uncoded script 未编码 Unknown 976,118All other code points
附注
  1. ^ ISO 15924 publications 截至2019年8月19日 (2019-08-19)
  2. ^ ISO 15924 Normative text file 截至2019年8月19日 (2019-08-19)
  3. ^ ISO 15924 Changes (including Aliases for Unicode; 截至2019年8月19日 (2019-08-19))
  4. ^ Unicode version 12.1
  5. ^ Unicode charts
  6. ^ Unicode uses the "Property Value Alias" (Alias) as the script-name. These Alias names are part of Unicode and are published informatively next to ISO 15924

Unicode中缺少的文本

随着Unicode的每个新版本发布,国际字符代码中都添加了新的书写系统。根据加州大学伯克利分校的语言学家Deborah Anderson博士的一份声明,Unicode中尚有100多种书写系统未包含。

根据德国美因茨应用科学大学、法国ANRT Nancy和美国加州大学伯克利分校的项目“Missing Scripts”清单,根据目前的研究状况(2022年1月),人类已知的书写系统有294种。其中131个尚未以Unicode编码,即尚不能在计算机或手机上使用。

参见

参考资料

  1. . unicode.org. [2022-10-24]. (原始内容存档于2015-12-26).
  2. . unicode.org. [2022-10-24]. (原始内容存档于2022-10-19).
  3. (PDF). Mountain View, CA: Unicode, Inc. September 2022 [2022-10-24]. ISBN 978-1-936213-32-0. (原始内容存档 (PDF)于2022-10-07).
  4. https://www.unicode.org/roadmaps/ 页面存档备份,存于 Roadmaps to Unicode
  5. . www.unicode.org. [2022-10-24]. (原始内容存档于2022-10-05).
  6. . Unicode Consortium. 2018-05-25 [2018-09-12].
  7. . Unicode Consortium. 2018-08-08 [2018-09-12].
  8. Michael Everson. . 1997-09-18.
  9. The Unicode Consortium. . 2001-08-14.

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.