Unicodeによる古ジャワ語のローマ字翻字

古ジャワ語は現代ジャワ語やインドネシア語と同じくオーストロネシア語族に属しています。古ジャワ語はインドからもたらされた文化の影響によって大量のサンスクリットの語彙を含んでいることが特徴です。そのため、古ジャワ語のテキストをローマ字に翻字して研究で取り扱うためには古ジャワ語とサンスクリットの表記の両方を考慮する必要があります。このページはそのような研究の便宜をはかることを目的としています。

古ジャワ語の史資料(刻文や貝葉写本)は南インド系ブラーフミー文字に起源をもつ古ジャワ文字で記録されています。古ジャワ語には大量のサンスクリット語彙が含まれているため、古ジャワ文字には古ジャワ語だけではなくサンスクリットの音も表現するための工夫がなされています。そのため、古ジャワ文字をローマ字に転写(transliteration、翻字)するためには、一般に、サンスクリットの標準的な翻字方式(International Alphabet of Sanskrit Transliteration, IAST)に準じた方式が用いられています。この方式では、標準的なローマ字の他に特殊記号(diacritical mark)を使った特殊文字が必要となります。コンピュータが登場した当初は、基本的なローマ字と数字と若干の記号のみを表示するASCII文字コードしか処理できなかったため、ASCII文字コードだけでサンスクリットを翻字するための方式がいくつか創案されました。代表的なものとして京都・ハーバード方式があります。しかし、現在ではUnicodeに対応したフォントを使うことによって、どのようなパソコンでも標準的な翻字が処理できるようになりました。

Unicodeはブロックと呼ばれる関連する文字の集合から構成されています。たとえば、標準的な英語のアルファベットを表示するためにはBasic Latin(U+0000-U+007F)と呼ばれるブロックが使われています。古ジャワ語およびサンスクリットのローマ字転写をパソコンで表示するために必要な文字は、Basic Latinに加えて、Latin-1 Supplement (U+0080-U+00FF)、Latin Extended-A (U+0100-U+017F)、Latin Extended Additional (U+1E00-U+1EFF)と呼ばれる4つのブロックに分散しています。したがって、古ジャワ語およびサンスクリットのローマ字転写を表示するためには、これら4つのブロックの文字をすべて含んだフォントがパソコンにインストールされていることが必要となります。

Windowsパソコンの場合、ローマン体のTimes New Roman(バージョン3.10以上)とゴシック体のTahoma(バージョン3.14以上)がお奨めです。これらのフォントはWindows VistaまたはWindows 7以上のパソコンであれば標準でインストールされているはずです。なお、このページはローマン体のDoulos SILで表示するように設定されています。

MS Wordを使用している場合には、特殊文字を入力する簡単な方法が2つあります。いずれか使いやすいと思う方を利用してください。

  • 1) 表示したい文字に対応するUnicodeの4桁の16進数コードを打ち込み、「Alt」キーを押しながら「X」キーを押します。入力された4桁のコードが対応する文字に自動的に変換されます。
  • 2) 「Alt」キーを押しながら、表示したい文字に対応するUnicodeの4桁の10進数コードを打ち込み、「Alt」キーを離します。入力された4桁のコードが対応する文字に自動的に変換されます。
  • パソコンで古ジャワ語およびサンスクリットのローマ字転写を入力するための方法については「Unicodeを用いてサンスクリットのローマ字転写をパソコンで表示する方法―Windows 編―」(PDF)にまとめているので参照してください。

    表1には、サンスクリット由来の語を含む古ジャワ語の音の体系を子音と母音にわけて表示しています。表2には、古ジャワ語およびサンスクリットのローマ字翻字で用いられることがある特殊文字をアルファベット順にならべ、あわせて対応するUnicodeのコードを表示しました。表3には、あまり一般的ではない翻字方式で用いられる特殊文字と、インドネシア語の表記で使われる特殊文字を参考のために表示しています。

    表1A 古ジャワ語の音の体系(子音)

    無声無気 (unvoiced) 無声有気 (aspirated unvoiced) 有声無気 (voiced) 有声有気 (aspirated voiced) 鼻音 (nasal)
    軟口蓋音 (velar) k kh g gh
    硬口蓋音 (palatal) c ch j jh ñ
    反舌音 (retroflex) ṭh ḍh
    歯音 (dental) t th d dh n
    唇音 (labial) p ph b bh m
    半母音 (semi-vowel) 歯擦音 (sibilant) 気音 (aspirate)
    軟口蓋音 (velar) h
    硬口蓋音 (palatal) y ś
    反舌音 (retroflex) r
    歯音 (dental) l s
    唇音 (labial) v

    表1B 古ジャワ語の音の体系(母音)

    短母音aĕiu
    長母音āöīūeaioau

    表2 古ジャワ語およびサンスクリットのローマ字転写で用いられることがある特殊文字ならびに対応するユニコード(アルファベット順)

    文字 10進数コード 16進数コード ユニコードでの名称
    1 ā 0257 0101 LATIN SMALL LETTER A WITH MACRON
    2 Ā 0256 0100 LATIN CAPITAL LETTER A WITH MACRON
    3 7681 1E0D LATIN SMALL LETTER D WITH DOT BELOW
    4 7680 1E0C LATIN CAPITAL LETTER D WITH DOT BELOW
    5 ĕ 0277 0115 LATIN SMALL LETTER E WITH BREVE
    6 7717 1E25 LATIN SMALL LETTER H WITH DOT BELOW
    7 ī 0299 012B LATIN SMALL LETTER I WITH MACRON
    8 Ī 0298 012A LATIN CAPITAL LETTER I WITH MACRON
    9 7735 1E37 LATIN SMALL LETTER L WITH DOT BELOW
    10 7747 1E43 LATIN SMALL LETTER M WITH DOT BELOW
    11 7749 1E45 LATIN SMALL LETTER N WITH DOT ABOVE
    12 ñ 0241 00F1 LATIN SMALL LETTER N WITH TILDE
    13 7751 1E47 LATIN SMALL LETTER N WITH DOT BELOW
    14 ö 0246 00F6 LATIN SMALL LETTER O WITH DIAERESIS
    15 7771 1E5B LATIN SMALL LETTER R WITH DOT BELOW
    16 7770 1E5A LATIN CAPITAL LETTER R WITH DOT BELOW
    17 7773 1E5D LATIN SMALL LETTER R WITH DOT BELOW AND MACRON
    18 7772 1E5C LATIN CAPITAL LETTER R WITH DOT BELOW AND MACRON
    19 ś 0347 015B LATIN SMALL LETTER S WITH ACUTE
    20 Ś 0346 015A LATIN CAPITAL LETTER S WITH ACUTE
    21 7779 1E63 LATIN SMALL LETTER S WITH DOT BELOW
    22 7789 1E6D LATIN SMALL LETTER T WITH DOT BELOW
    23 ū 0363 016B LATIN SMALL LETTER U WITH MACRON

    補注: はVisarga、 はAnusvāraと呼ばれます。

    表3 その他の特殊文字

    文字 10進数コード 16進数コード ユニコードでの名称 注意
    1 7745 1E41 LATIN SMALL LETTER M WITH DOT ABOVE 表2-9(ṃ, anusvāra)の別表記。
    2 ŋ 0331 014B LATIN SMALL LETTER ENG 表2-10(ṅ)の別表記
    3 ç 0231 00E7 LATIN SMALL LETTER C WITH CEDILLA 表2-18(ś)の別表記。セディーユ(cédille)記号のついたc。ただのcと紛れやすいので注意。
    4 Ç 0199 00C7 LATIN CAPITAL LETTER C WITH CEDILLA 表2-19(Ś)の別表記。セディーユ(cédille)記号のついたC。ただのCと紛れやすいので注意。
    5 é 0233 00E9 LATIN SMALL LETTER E WITH ACUTE アクサンテギュ(accent aigu)記号のついたe。インドネシア語表記においてeをĕから区別する必要があるときに用いる。

    参考文献

    参考サイト

    ver1.1 2008-05-26. ver1.2 2008-07-07. ver1.3 2008-08-21.ver1.4 2008-09-10. ver1.5 2010-07-16. ver2.0 2013-08-01.