Unicodeによる古ジャワ語のローマ字翻字

古ジャワ語は現代ジャワ語やインドネシア語と同じくオーストロネシア語族に属しています。古ジャワ語はインドからもたらされた文化の影響によって大量のサンスクリットの語彙を含んでいることが特徴です。そのため、古ジャワ語のテキストをローマ字に翻字して研究で取り扱うためには古ジャワ語とサンスクリットの表記の両方を考慮する必要があります。このページはそのような研究の便宜をはかることを目的としています。

古ジャワ語の史資料(刻文や貝葉写本)は南インド系ブラーフミー文字に起源をもつ古ジャワ文字で記録されています。古ジャワ語には大量のサンスクリット語彙が含まれているため、古ジャワ文字には古ジャワ語だけではなくサンスクリットの音も表現するための工夫がなされています。そのため、古ジャワ文字をローマ字に転写(transliteration、翻字)するためには、一般に、サンスクリットの標準的な翻字方式(IATS)に準じた方式が用いられています。この方式では、標準的なローマ字の他に特殊記号(diacritical mark)を使った特殊文字が必要となります。コンピュータが登場した当初は、ASCII文字コードしか処理できなかったため、特殊文字をどのように処理するかで混乱した時期もありましたが、現在ではUnicodeに対応したフォントを使うことによって、どのようなパソコンでも同じように処理することができるます。

Unicodeにおいては、古ジャワ語の翻字に必要な文字は、Basic Latin (U+0000-U+007F)の他に、Latin-1 Supplement (U+0080-U+00FF)、Latin Extended-A (U+0100-U+017F)、Latin Extended Additional (U+1E00-U+1EFF)に分散しています。そのため、パソコンでこれらの文字を処理したり、ブラウザで正しく表示させるためには、使用しているパソコンに上述の範囲を含むユニコード対応のフォントがインストールされていることが必要です。現時点でこの条件にあうフォントとしては、セリフ体のDoulos SIL、サンセリフ体のTahomaがあります。このページではDoulos SILで表示するように設定されています。下記のリンク先からダウンロードし、パソコンにインストールしてからこのページを表示してください。

MS Wordを使用している場合には、特殊文字を入力する簡単な方法があります。ALTキーを押し下げた状態で10進コードのUnicode(数字4桁)を打ち込みALTキーを離すと該当する特殊文字が入力されます。

表1には、サンスクリット由来の語を含む古ジャワ語の音の体系を子音と母音にわけて表示しています。表2には、古ジャワ語およびサンスクリットのローマ字翻字で用いられることがある特殊文字をアルファベット順にならべ、あわせて対応するUnicodeを表示しました。表3には、あまり一般的ではない翻字方式で用いられる特殊文字と、インドネシア語の表記で使われる特殊文字を参考のために表示しています。

表1A 古ジャワ語の音の体系(子音)

無声無気 (unvoiced) 無声有気 (aspirated unvoiced) 有声無気 (voiced) 有声有気 (aspirated voiced) 鼻音 (nasal)
軟口蓋音 (velar) k kh g gh
硬口蓋音 (palatal) c ch j jh ñ
反舌音 (retroflex) ṭh ḍh
歯音 (dental) t th d dh n
唇音 (labial) p ph b bh m
半母音 (semi-vowel) 歯擦音 (sibilant) 気音 (aspirate)
軟口蓋音 (velar) h
硬口蓋音 (palatal) y ś
反舌音 (retroflex) r
歯音 (dental) l s
唇音 (labial) v

表1B 古ジャワ語の音の体系(母音)

短母音aĕiu
長母音āöīūeaioau

表2 古ジャワ語およびサンスクリットのローマ字転写で用いられることがある特殊文字ならびに対応するユニコード(アルファベット順)

文字 10進コード 16進コード ユニコードでの名称
1 ā 0257 0101 LATIN SMALL LETTER A WITH MACRON
2 Ā 0256 0100 LATIN CAPITAL LETTER A WITH MACRON
3 7681 1E0D LATIN SMALL LETTER D WITH DOT BELOW
4 7680 1E0C LATIN CAPITAL LETTER D WITH DOT BELOW
5 ĕ 0277 0115 LATIN SMALL LETTER E WITH BREVE
6 7717 1E25 LATIN SMALL LETTER H WITH DOT BELOW
7 ī 0299 012B LATIN SMALL LETTER I WITH MACRON
8 Ī 0298 012A LATIN CAPITAL LETTER I WITH MACRON
9 7735 1E37 LATIN SMALL LETTER L WITH DOT BELOW
10 7747 1E43 LATIN SMALL LETTER M WITH DOT BELOW
11 7749 1E45 LATIN SMALL LETTER N WITH DOT ABOVE
12 ñ 0241 00F1 LATIN SMALL LETTER N WITH TILDE
13 7751 1E47 LATIN SMALL LETTER N WITH DOT BELOW
14 ö 0246 00F6 LATIN SMALL LETTER O WITH DIAERESIS
15 7771 1E5B LATIN SMALL LETTER R WITH DOT BELOW
16 7770 1E5A LATIN CAPITAL LETTER R WITH DOT BELOW
17 7773 1E5D LATIN SMALL LETTER R WITH DOT BELOW AND MACRON
18 7772 1E5C LATIN CAPITAL LETTER R WITH DOT BELOW AND MACRON
19 ś 0347 015B LATIN SMALL LETTER S WITH ACUTE
20 Ś 0346 015A LATIN CAPITAL LETTER S WITH ACUTE
21 7779 1E63 LATIN SMALL LETTER S WITH DOT BELOW
22 7789 1E6D LATIN SMALL LETTER T WITH DOT BELOW
23 ū 0363 016B LATIN SMALL LETTER U WITH MACRON

補注: はVisarga、 はAnusvāraと呼ばれます。

表3 その他の特殊文字

文字 10進コード 16進コード ユニコードでの名称 注意
1 7745 1E41 LATIN SMALL LETTER M WITH DOT ABOVE 表2-9(ṃ, anusvāra)の別表記。
2 ŋ 0331 014B LATIN SMALL LETTER ENG 表2-10(ṅ)の別表記
3 ç 0231 00E7 LATIN SMALL LETTER C WITH CEDILLA 表2-18(ś)の別表記。セディーユ(cédille)記号のついたc。ただのcと紛れやすいので注意。
4 Ç 0199 00C7 LATIN CAPITAL LETTER C WITH CEDILLA 表2-19(Ś)の別表記。セディーユ(cédille)記号のついたC。ただのCと紛れやすいので注意。
5 é 0233 00E9 LATIN SMALL LETTER E WITH ACUTE アクサンテギュ(accent aigu)記号のついたe。インドネシア語表記においてeをĕから区別する必要があるときに用いる。

参考文献

参考サイト

ver1.1 2008-05-26. ver1.2 2008-07-07. ver1.3 2008-08-21.ver1.4 2008-09-10. ver1.5 2010-07-16.