罗马化
罗马化(英语:),又称拉丁化(),是语言学中将不是拉丁字母(又称罗马字母)形式的文本系统,转换成拉丁字母的过程。主要是将被转换系统里的非拉丁文本,按照转写系统的规则和转写表,忠实地将字符(也包括字符的附加符号及单音素双字符)对号入座地转写成转换系统里的拉丁字符。被转换系统与转换系统的字符也可以逆向转写。
罗马化的方案有很多,包括用以表达书面语的音译、和用以表达口语的转录。后者可以再被分为两类:音位转录,用以记录音素或者一段说话里的语义数量。和更严格的标音转录来记录说话声音。而每一个罗马化方案均有一套独立的规则,规定了每一个已罗马化字符的发音。除了拼音文本之外,现今唯一彻底采用语素文本系统的汉字也从近代起出现罗马化方案,但并未完全取代汉字原有的功能。
类似罗马化的文本转写型式还有「西里尔化」(又称「斯拉夫化」),即把一个语言音译或转录成西里尔字母的过程。
罗马化方案
字母转写
如果使用罗马化方案去把原来的字词去音译的话,最基本的原则就是把本来语言里的字母,逐一音译到目标语言之中。这个方法的特色,就是过程中并不着重在目标语言里的实际发音。例如,使用日语的训令式罗马字的话,就容许读者可以百分之百地,凭拼音去重组成日语的片假名音节。但这个方案需要事前对日语有一定的知识。
不同书写系统的罗马化方案
阿拉伯字母
阿拉伯字母是用来书写阿拉伯语、波斯语和乌尔都语。其罗马化方案如下:
- 德国摩尔根兰学会[1](1936年):被罗马的国际东方学者会议所使用,是以汉斯-威海辞典(ISBN 0879500034)为基础所发展的方案。
- BS 4280(1968年):由英国标准协会[2]发展的方案。
- 标准阿拉伯语技术性音译系统(1970年代):由美国军队发展的方案。
- 联合国地名专家组(1972年)[3]
- DIN-31635(1982年):由德国标准化协会所发展的方案。
- ISO 233(1984年):国际标准化组织的音译方案。
- 卡拉姆(1985年):一套着重保留字母串法,牺牲了发音的方案。 [4]
- ISO 233-2(1993年):国际标准化组织的简化音译方案。
- 毕克华尔特音译方译(1990年代):由施乐研究中心的添·毕克华尔特先生所发明的系统。[5]这个系统并不需要一些特别的发音区别符号。[6]
- 美国国会图书馆标准方案(1997年)[7]
婆罗米字母
婆罗米字母用以书写印度大陆和东南亚地方语言的书写系统。长久以来,西方都是通过其罗马化音译去研究梵文以及其他印度文本。自英国的东方学者威廉·琼斯爵士之后,不同的印度文本音译方案亦随之推出。[10]
汉语文本
汉语的罗马化,在某些层面上被证明是一个困难的问题,因为同时涉及政治考虑。另一个困难之处,就是汉语并非表音文本,而是意音文本。所以大部份的罗马化方案并非直接把汉字转换,而是建基于类似汉语拼音之上。[14]
传教士罗马化语言办报
- 发端:19世纪末,在中国的欧洲、美国传教士再次掀起兴办中文报刊的高潮。以美国佐治亚州的传教士编辑林乐知为首的一批传教士编辑认识到了非教会报纸具有广泛传播的可能性。为了扩大报刊的发行量,就需要使用更加通俗易懂的文本。作为针对文盲读者的极端方法,他们开始使用罗马化语言。他们起初曾持怀疑态度,因为这意味着报刊的传播元素将与汉字方块字彻底分离。这不仅预示着字母文本的引进,而且暗示了一种基于新文本的文学体系的形成。
- 莱普修斯字母表:德国传教士倾向于卡尔·理乍得·莱普修斯字母表
- 威廉·琼斯字母表:英国传教士倾向于推行威廉·琼斯的字母表
- 成果:在中国东南沿海方言丰富多变的地区,罗马化语言办报的计划取得了些许成功。例如,厦门土话约有800个音节,相比之下,在中国四分之三地区通用的标准官话只有420个音节。虽然不同地区的官话略有变化,但后来还是成为了全国性的标准语言。在香港,崇真会(巴色会)传教士娄士(G.Reusch)于1882年用罗马化的客家方言编纂一份插图月刊,每年订阅价为20美分。[18]在台湾,英国长老会差会的巴克礼(Thomas Barclay)创办一份用罗马拼音化的白话字印刷的教会月刊《台南府城教会报》(后更名台湾教会公报)。在汕头,英国长老会的传教士汲约翰(J.C.Gibson)也办过类似的《潮惠会报》,只是后来都因时局原因而停止,但白话字仍在民间传承。相反的,官话实行罗马化或者演变为单纯的拼音文本都不适用,因为它具有太多的同音异义字。因此,大多数传教士报刊不仅使用汉字印刷,而且采用中国传统的书册式报刊形制。
韩语
- 马科恩-赖肖尔转写系统(1937年):直至2002年为止,都是南韩官方的韩语罗马化方案。现时此系统仍于北韩使用。
- 罗马字标记法修正案(2000年):在2005年,南韩政府正式使用这套已于2000年批准的方案。路牌和教科书已经开始逐步跟随,政府估计此刻修订需要花费至少20亿美元。但人名拼音仍然可以按照个人意愿,但政府会强烈建议使用新方案。
- 耶鲁拼法(1942年):这套方案主要应用于学术文学层面。
- 美国国会图书馆标准方案:与McCune-Reischauer式大致上相同。[20]
- ISO/TR 11941(1996年):这套方案其实是由两个方案所组成,分别为南北韩两个国家所提出。最初提交上国际标准化组织的方案,是经过双方努力的成果(方案主要以耶鲁方案为基础)。但在最后阶段,双方出现方歧,导致出现了两个方案。[21]
泰语
泰语主要于泰国使用,有自己的一套文本去书写。该套书写系统可能是由古高棉传过来,属于婆罗米文本的一种。请参阅泰语字母。
- 皇家泰语转写通用系统
- 美国国会图书馆标准方案[22]
- ISO 11940(1998年):国际标准化组织的音译方案。
白俄罗斯语
白俄罗斯语同时使用了西里尔字母和拉丁字母。但时至今日,纵使仍然有使用拉丁字母(正式名称为Łacinka或Łacinica)的拥护者,但已经几乎绝迹。但姑勿论本来的拉丁字母存在与否,白俄罗斯语的名字一般按俄语的习惯被翻译。
例字 | |
---|---|
Łacinka字母 | 罗马化后 |
Homiel | Homyel' |
Mahiloŭ | Mahilyow |
Viciebsk | Vitsebsk |
Baranavičy | Baranavichy |
Žytkavičy | Zhytkavichy |
文献 | |
|
俄语
现时并没有一套国际公认把俄语翻译成罗马字母的方案—事实上已经有很多套方案存在:有时会稍作调整以迎合某些特定语言(例如德语和法语),而有些则设计为图书馆音译之用,有些则为翻译俄罗斯旅客护照之用。有时,有些名字的音译则是以传统为主。这样一来,同一个名字会重复出现很多次。例如,俄国著名作曲家柴可夫斯基可以被译成以下名字:Tchaykovsky, Tchajkovskij, Tchaikowski, Tschaikowski, Czajkowski, Čajkovskij, Čajkovski, Chajkovskij, Chaykovsky, Chaykovskiy, Chaikovski等等。
- BGN/PCGN(1947年):美国地名委员会的方案[24]
- GOST 16876-71(1983年):前苏联的国家标准委员会,测量及地图绘制部门的方案。[25]
- 联合国标准(1987年):以GOST方案上作基础,在俄罗斯国内及国外的绘图产品都开始被大量广泛使用。
- ISO 9(1995年):国际标准化组织的音译方案。
- 美国国会图书馆标准方案(1997年)[26]
- Volapuk编码(1990年):这是一个人们为了方便在网络上,使用拉丁字母发送消息,而使用的非正统俄语罗马化方案。(这里不是指沃拉普克语)
- 维基百科内部标准(2004年):从BGN/PCGN拼法引伸出来,特别于网上实际应用尤为重要。
总结
以下的表格列出了把不同字母或书写系统,作音位转录罗马化后的结果。虽然对大部份用户来说已经足够,但是每一个字母始终还有几个译法和其他例外例子。详情请参阅以下各个语言的相关条目。(由于韩语字母数量过于庞大,所以本表格只列出第一个字母)
罗马化后 | 希腊语 | 俄语 | 希伯来语 | 阿拉伯语 | 日语片假名 | 韩语 |
A | A | А | ַ, ֲ, ָ | دَ, دَ, ﺍ — ﺎ, دَىا | ア | |
AI | י ַ | |||||
B | Б | בּ | ﺏ ﺑ ﺒ ﺐ | ㅂ | ||
CH | Χ | Ч | ㅊ | |||
CHI | チ | |||||
D | Δ | Д | ד | ﺩ — ﺪ, ﺽ ﺿ ﻀ ﺾ | ㄷ | |
DH | ﺫ — ﺬ | |||||
E | Ε | Э | , ֱ, י ֵֶ, ֵ, י ֶ | エ | ||
F | Φ | Ф | פ (final ף ) | ﻑ ﻓ ﻔ ﻒ | ||
FU | フ | |||||
G | Γ | Г | ג | ㄱ | ||
GH | ﻍ ﻏ ﻐ ﻎ | |||||
H | ח, ה | ﻩ ﻫ ﻬ ﻪ, ﺡ ﺣ ﺤ ﺢ | ㅎ | |||
HA | ハ | |||||
HE | ヘ | |||||
HI | ヒ | |||||
HO | ホ | |||||
I | Η, Ι, Υ | И | ִ, י ִ | دِ | イ | |
IY | دِي | |||||
J | Ж | ﺝ ﺟ ﺠ ﺞ | ㅈ | |||
JJ | ㅉ | |||||
K | Κ | К | כּ (final ךּ ), ק | ﻙ ﻛ ﻜ ﻚ | ㅋ | |
KA | カ | |||||
KE | ケ | |||||
KH | Х | כ (final ך ) | ﺥ ﺧ ﺨ ﺦ | |||
KI | キ | |||||
KK | ㄲ | |||||
KO | コ | |||||
KU | ク | |||||
L | Λ | Л | ל | ﻝ ﻟ ﻠ ﻞ | ||
M | Μ | М | מ (final ם ) | ﻡ ﻣ ﻤ ﻢ | ㅁ | |
MA | マ | |||||
ME | メ | |||||
MI | ミ | |||||
MO | モ | |||||
MU | ム | |||||
N | Ν | Н | נ (final ן ) | ﻥ ﻧ ﻨ ﻦ | ㄴ | |
NA | ナ | |||||
NE | ネ | |||||
NI | ニ | |||||
NO | ノ | |||||
NU | ヌ | |||||
O | Ο, Ω | О | , ֳ, וֹֹ | オ | ||
P | Π | П | פּ (final ףּ ) | ㅍ | ||
PP | ㅃ | |||||
PS | Ψ | |||||
Q | ﻕ ﻗ ﻘ ﻖ | |||||
R | Ρ | Р | ר | ﺭ — ﺮ | ㄹ | |
RA | ラ | |||||
RE | レ | |||||
RI | リ | |||||
RO | ロ | |||||
RU | ル | |||||
S | Σ | С | ס, שֹ | ﺱ ﺳ ﺴ ﺲ, ﺹ ﺻ ﺼ ﺺ | ㅅ | |
SA | サ | |||||
SE | セ | |||||
SH | Ш | ש | ﺵ ﺷ ﺸ ﺶ | |||
SHCH | Щ | |||||
SHI | シ | |||||
SO | ソ | |||||
SS | ㅆ | |||||
SU | ス | |||||
T | Τ | Т | ט, תּ, ת | ﺕ ﺗ ﺘ ﺖ, ﻁ ﻃ ﻄ ﻂ | ㅌ | |
TA | タ | |||||
TE | テ | |||||
TH | Θ | ﺙ ﺛ ﺜ ﺚ | ||||
TO | ト | |||||
TS | Ц | צ (final ץ ) | ||||
TSU | ツ | |||||
TT | ㄸ | |||||
U | У | , וֻּ | دُ | ウ | ||
UW | دُو | |||||
V | B | В | ב, ו, וו | |||
W | ﻭ — ﻮ | |||||
WA | ワ | |||||
WE | ヱ | |||||
WI | ヰ | |||||
WO | ヲ | |||||
X | Ξ | |||||
Y | Й, Ы | י | ﻱ ﻳ ﻴ ﻲ | |||
YA | Я | ヤ | ||||
YE | Е | |||||
YO | Ё | ヨ | ||||
YU | Ю | ユ | ||||
Z | Ζ | З | ז | ﺯ — ﺰ, ﻅ ﻇ ﻈ ﻆ | ||
ZH | Ж |
参考文献
- . [2021-12-31]. (原始内容存档于2017-08-10).
- . [2013-04-25]. (原始内容存档于2008-10-07).
- (PDF). 2018-06 [2005-08-20]. (原始内容存档 (PDF)于2021-02-11).
- . [2015-07-02]. (原始内容存档于2009-02-08).
- . qamus.org. [2005-08-20]. (原始内容存档于2021-02-24).
- . [2021-12-31]. (原始内容存档于2002-04-24).
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2017-12-15).
- (PDF). 2013-02 [2005-08-20]. (原始内容存档 (PDF)于2021-01-25).
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-22).
- . [2005-08-20]. (原始内容存档于2004-03-15).
- 详情请参阅:Transliteration of Indic scripts: how to use ISO 15919 (页面存档备份,存于)
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2020-12-10).
- . [2006-11-20]. (原始内容存档于2007-02-12).
- . [2005-08-20]. (原始内容存档于2004-06-19).
. [2005-08-20]. (原始内容存档于2021-03-17). - (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-23).
- . www.loc.gov. [2005-08-20]. (原始内容存档于2021-04-14).
- . 2000-10-16 [2005-08-20]. (原始内容存档于2017-09-17).
- JOHN MURDOCH.Report on Christian Literature in China.Shanghai 1882.pp7-8,12,19-20
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-04-20).
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-20).
- 两个方案的分别:Hangul and Other Languages (页面存档备份,存于)
- (PDF). [2005-08-20]. (原始内容存档 (PDF)于2008-12-11).
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-01-15).
- . [2013-04-25]. (原始内容存档于2012-07-16).
- . www.ccl.net. 1992-12-30 [2005-08-20]. (原始内容存档于2021-03-17).
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-04-25).
- (PDF). www.lov.gov. [2005-08-20]. (原始内容存档 (PDF)于2021-03-22).
- . [2005-01-25]. (原始内容存档于2005-03-07).
- (PDF). 2003-01 [2021-12-31]. (原始内容 (PDF)存档于2006-01-03).
- 托马士.彼得逊先生撰写的五个系统对比:Transliteration of Ukrainian (页面存档备份,存于)
- . [2005-01-25]. (原始内容存档于2004-12-10).
- (PDF). www.loc.gov. [2005-08-20]. (原始内容存档 (PDF)于2011-05-13).
外部链接
- 联合国地名专家组-罗马化系统工作组 (页面存档备份,存于)
- 美国国会图书馆-罗马化列表 (页面存档备份,存于)(PDF文档)
- Java罗马化程序
- 尚有少量书籍附有罗马化列表《ALA-LC Romanization Tables》Randall Barry (ed.), U.S. Library of Congress, 1997, ISBN 0844409405.
- Thomas T. Pederson's chart (页面存档备份,存于)