文本
文本(script)是人类用来记录和传播语言的书写符号系统[1][2],可单独或经组合表达某种或某些语意信息[3]。书写系统(writing system)则是一种基于文本和使用规则以利在视觉上表现口语沟通的方法。
![]() 文本 |
---|
文本史 |
字位 |
文本列表 |
拼音文本相关 |
字母 |
字母的历史 |
文本系统类型 |
表音文本 |
全音素文本 |
辅音音素文本 |
元音附标文本 |
半音节文本 |
特征文本 |
音节文本 |
语素文本 |
辅助使用 |
速记 |
音标 |
特殊使用 |
数字 |
盲文 |
相关条目 |
象形文本 |
形意文本 |
搭配使用的符 号 |
附加符号 |
标点符号 |
可转换为文本 的其他使用 |
电报编码 |
字符 |
类文本是新石器时代早期的书写符号系统,用来记录特定事物、简化图像。文本在发展早期都是图画形式的,有些是以形表意,有些是以形表音,其中有表意文本(象形文本,以形表意的文本),与语音无甚关系,中国文本便是从此渐次演变而成。有些中文本可以从表面、部首、字旁看到一些联系旁通的字义。而这些特色是拼音文本所没有的。所以古代中国文本在不同的语系区域拥有不同发音,即方言的存在。汉字已经被邻近的族群借用其文本用作为书写纪录。一般认为,文本是文明社会的标志。
有些文本是以形表音的图画文本,其后历经不同演变,部分发展成语言的符号系统,后亦可用来纪录人生经验与见闻。除了汉字及其衍生文本之外,当代世界绝大部分的文本的历史都可追溯至古埃及圣书体文本。
以形表音的图画文本经过不断的发展,从古埃及文、罗马文本、及拉丁文字则发展到后期都成为语音符号,即文本的字母,不同的字母合并成一个文本。由于不同字母分别付予一个音,不同的字母合并成切音(混音),形成音节,合并不合的音节,成为了记录语音的表音文本。
文本史

依现在的观点,侧重表意或侧重表音是文本的不同发展方向。有研究者认为,人类的文本史分为形意文本、意音文本和拼音文本三个发展方向[4][5]:
象形文本
又称为表意文本,是一种以图像表示内容的象形符号。像中文中的“日”、“月”等字都属于象形文本。象形文本是文本萌芽时期的产物,主要的优势便是易于理解,一看便懂,用于记录语言会有些困难,尤其是纪录虚词,可以分为四种类型--刻符、岩画、文本画和图画字。不过到今天,这种表达意义的符号依旧很常见。比如网络上流行的颜文本。
意音文本
有些意音文本是由象形文本发展而来的,这种文本既吸收了象形文本易于理解的优点,又吸收了拼音文本造字方便的优势,尤其是对于虚词的造字,同时汉字摒弃了原音意文本中的读音成分,形成了一种独特的指示会意文本系统,克服了拼音文本只能被一种语言拘束的缺点,无论是操何种语言都可以用一套指示会意文本来很好的交流。有的语言学者认为意音文本代表人类文本史走出原始时期,进入高度文明时期,而这种文本已经可以编写历史了。如两河流域的楔形文本、古埃及的圣书体、中国的汉字、中美洲的玛雅象形文本。发展成熟而又代表高度文化的意音文本不多,目前主要有中国的汉字。楔形文本、圣书体、玛雅象形文本早已没人使用(有学者认为楔形文本、圣书体、玛雅文本其实仍然只是一种以形表音的表音文本不应看做音意文本,但更多人认为实际上所有的文本字形本来就都是用来记录语音的,按这种观点连汉字都是表音文本了),汉字是当今世界上仍被广泛采用的意音文本。但意音文本的缺点也是极为明显的,意音文本对应每项事物解释会创一个字体来表达,若将来遇到现有文本库没有对应解释的字,在新的字体创造与决定出来前,该事物便无法普遍表达,因此意音文本对应新事物的限制较大,没有拼音文本使用上的弹性。但是也可以通过组合其他字词而产生新的意思。像是"母牛",而不是用牝。
拼音文本
又称为字母文本,有些学者认为是同形意文本和意音文本人类文本的第三个方向,只以简单的笔画来标音,而且泛用性高,可以套用在多数语言。
- 汉语拼音:根据字母所表示的语音单位,拼音文本可以分成以下两类:半音节文本和全音素文本。
- 英文拼写:用字母来表示语音的文本。
- 现在世界各国所用的文本多数是拼音文本,中国的藏文、蒙古文、维吾尔文等也都是拼音文本。
分类:
- 半音节文本:一个字母所表示的语音单位介于音节和音位之间,如注音字母。
- 元音附标文本和辅音音素文本:一个字母表示一个音位,但是元音和辅音区别对待。
- 全音素文本:一个字母表示一个音位,现今绝大多数存在的文本系统都是属于拼音文本。目前最多语言使用的拼音文本系统是拉丁字母。
与音节文本的区别:
拼音文本(音素文本)和音节文本(日文)的区别是,音节文本的一个字位表示一个音节,如日文假名;而拼音文本的一个字位只表示一个音素。
周有光等某些学者曾提出字母文本的发展又分为三个时期:
但这种观点明显不符合考古和历史,例如腓尼基字母直接脱胎于埃及圣书体,并没有经过音节文本阶段。因此该观点是不对的。
基本术语

各种文本的研究已独立发展相当长的一段时间,因此有些术语的定义可能会随领域或是文本而不同。
文本(text)一词一般是指书面数据。编写及记录文本可称为写作,观看及解释文本的活动则称为阅读。正字法是指字母系统的方式及规则,也包括拼音的概念。
字位是写作系统的一个特殊基础单位,是最小的有意义元素。字位的概念类似语言中的音位,例如在使用拉丁字母的英文,字位包括二十六个字母的大写及小写,一些附加符号,以及阿拉伯数字等。
一个字位可能会以不同的方式表示,有些变化在视觉上可以清楚的识别,但这些不同的表示方式仍对应同一个字位,这称为字位的异形文本,类似语言学研究中的同位异音。例如小写字母a在手写体及印刷体的字形都有所不同。会选用的异形文本和使用的媒介、写作器具、写作者的风格、前后文本的形状、预期的读者等有关。
有时会字形或字母之类的词来表示字位。常见的用法也随领域而不同。比较楔形文本、玛雅象形文本及汉字,大部份书写系统的字位是由直线(或笔画)所组成,因此称为「线性文本系统」,但也有字位不由直线构成的「非线性文本系统」,像楔形文本及点字。
文本是和对应的语言一様,是一种概念系统。若文本可以表达所有语言可以表示到的极致,则此文本可以称为「完整」。
文本类型
类型 | 每字位代表 | 范例 | ||
---|---|---|---|---|
语素文本 | 语素 | 汉字 | ||
表音文本 | 音节文本 | 音节 | 日文假名、女书 | |
拼音文本 | 全音素文本 | 音素(辅音或元音) | 拉丁字母、希腊字母、西里尔字母(西里尔字母中有个别字母也表示一个音节,如Е、Ю、Я等) | |
元音附标文本 | 音素(辅音及元音) | 印度天城文、泰文、缅甸文 | ||
辅音音素文本 | 音素(辅音) | 阿拉伯字母、希伯来字母 | ||
半音节文本 | 介于音节和音素之间 | 中文注音符号、伊比利亚文本 |
注:1.这里音素和音位(英语:)同义。 2.语素文本又称意音文本。
语素文本

语素文本也称为表意文本是表示词或语素(语言的最小语义单位)的文本,一般来说可以分解为字位,一个字位代表一个语素。语素文本的文本本身可能有表示声音、意义或是形状的部份。例如汉字及楔形文本都属于语素文本。
音节文本
音节文本是表音文本的一种,是一套代表着用以构成词的音节和音拍的字位,一般一个音节对应一个字符。[6]音节文本中的字位被称为「syllabogram」,一般是由一个辅音(不是必须有)加上一个在后的元音组合而成,比如音节CV或V。有些表音文本中,可以看到CVC的组合和代表CV发音的字。代表有日语的假名。像假名一样并不是音素的组合,各音节有独自字位的音节文本,在世界上也是相当稀少的。
拼音文本(或称音素文本)
全音素文本
特征文本
盲文
盲人使用的文本,透过特定工具在纸张上制作出不同组合的凸点而组成。盲文的基本单位是长方形的盲符,有位置固定的六个点,每个点可以凸出或不凸出,形成64种可能之表达方式。
文本的图像上分类
也许,最主要以图像上区别来分类的是线条。线条书写系统是指字符由许多线条所组成,如拉丁字母和汉字。汉字如果是用原子笔、毛笔或铸刻在青铜器上,则视为是线性的。类似地,埃及象形文本和玛雅文本则通常是描绘线性外框,但在正式场合,他们雕刻在bas-relief中。另一方面,非线性系统则如盲文,不论是用什么材质,都非由线条构成。最早的例子则是线条的:西元前3300年的楔形文本是线条的,虽然从它衍生的楔形文本不是。
楔形文本也许是最早的非线条文本。它的字形是由芦苇笔尖所压制在潮湿泥板而成,而非之前在泥板上用笔尖描绘线条。 最后变成其文本的字根外观上的变化。
盲文则是拉丁文本的非线条版本,它完全放弃拉丁文本的外形。字母是由凸块所组成,其基底可以是皮革(路易斯·布莱叶原本采用的材质),坚硬塑料或金属。
也有拉丁文本的非线条的短暂性版本,包含摩尔斯电码,手语的manual alphabet版本和借由旗帜或布条放置在不同角度旗语。然而,如果文本是定义成永久纪录信息的能力的话,因为这些符号很快就会消失,则这些系统根本并非文本。
书写方向
文稿的一项特征是它们书写的方向。埃及圣书体可以任一方向横写,只要动物或人的字形面向书写它们的方向。早期的字母可以被以很多方向书写,包含横向(左至右或右至左)或纵向(上或下)。它一般是用牛耕式转行书写法。由一个(水平)方向开始,然后在一行结尾转折以反方向书写。
希腊字母和其后继者则是左至右的模式,然后在一页中由上往下写。在Timed Text (TT) Authoring Format中,这个模式被简称为LRTB[7]。其它文本,如阿拉伯文本和希伯来语则由右至左书写。汉字传统上是纵向书写(上至下),接着在页中由右至左排列。但近年来因为西方文化的影响,为了能使用罗马字母的术语及电子文档的技术上限制,则逐渐出现由左至右,上而下的方式书写,但传统写法在台湾、马来西亚华人社会仍然常见,甚至迁就于无法直写,以「一字一行」方式,由右向左横写的书写方式也尚未完全消失(例如匾额)。回鹘文本母和其后继者则是由上至下,左至右的文本;这种方向源自于将祖传闪语方向90°逆时针方向以便在外观上适合中文书写。一些菲律宾和印度尼西亚的文本,如哈努诺文,则是以远离写者方向,由下而上的方式书写。
最常见的几种文本
世界上有文本的语言里,绝大多数都是用以下文本形式写成的:
其它的(往往是孤立的)文本形式有: 回鹘字母、亚美尼亚字母、叙利亚字母、希伯来字母、格鲁吉亚字母、吉兹字母、它拿字母 、提非纳文本、加拿大原住民音节文本、古匈牙利字母等
文本对人类的影响
- 系统的语言使人于禽兽分离,而文本则使人步入文明社会。
- 使历史脱离了口传身授的阶段,得以记录历史,进入文明时代;
- 突破时间限制,后人可通过文本了解前人已取得之成就,人类的思想、文化不会失传中断,而文本使文明得以延续,文化得以累积;
- 突破空间限制,不同地区之人可通过文本系统转译进行交流;
- 在文明社会中,文本作为高效的信息传播工具,大大提高了文化、思想、艺术、技术等人类文明的传播速度和效率。
文本列表
在当今大的语种里,文本主要分为:
- 半音节文本
参考数据
- . : 1373.
- . www.termonline.cn. [2023-12-24]. (原始内容存档于2023-12-24).
- . www.termonline.cn. [2023-12-24]. (原始内容存档于2023-12-24).
- . Qkzz.net. [2014-04-09]. (原始内容存档于2020-12-06).
- . [2014-04-09]. (原始内容存档于2021-03-11).
- 葛本仪. . 五南图书出版股份有限公司. 2002: 356–357. ISBN 9789571128511.
- . W3.org. [2014-04-09]. (原始内容存档于2018-02-03).