コンピュータサイエンス誌『bit』1998年6月号

海外事情・アジアから モンゴル編
モンゴル語文字処理の現状

上村 明





 モンゴル国では、社会主義時代に採用されたキリル(ロシア)文字をこのまま公用文字として使用しつづけるのか、あるいはチンギス・ハーンが採用したという伝説のあるモンゴル文字を公用文字とするのか、はっきりとした結論がまだ出されていない。モンゴル語を書き表す文字の問題は、民族主義ともからむ非常に微妙な問題だ。
 そんな中、モンゴル文字のコンピュータ処理の国際標準作りの作業が、モンゴル国、中国内モンゴル自治区などの共同で行なわれている。今回はそのへんの動きを中心に、コンピュータによるモンゴル語処理の問題と現状を紹介してみたい。

「モンゴル文字コンピュータ化に関するワークショップ」
 今年1月の末、ユネスコ関連の調査でモンゴルに行く途中、モンゴル国立大学の数学の教師だったエルデネチメグ先生と、北京からの飛行機の中で偶然乗り合わせた。現在の勤め先である国連大学(ソフトウェア技術研究所)のあるマカオからウランバートルの実家に帰り、モンゴルで旧正月を過ごすつもりだという。
 彼女とは1992年夏やはりユネスコの主催でウランバートルで開かれた「モンゴル文字のコンピュータ化に関するワークショップ」で知り合った。物理学者であるロドイサンバ教授をチーフとする彼女たちモンゴル国立大学のグループは、DOS上で動くモンゴル文字のワープロ・ソフト「ソダルチ」を開発して、このワークショップに参加していたのだ。
 モンゴル文字は、縦書きだが行は左から右に進む。ちょうどアラビア文字を右に90度回転させたところを思い浮かべるとよい。もともとこの2つの文字は共通の祖先を持ち、モンゴル文字の直接の祖先であるウイグル文字も古くは横書きだったという説もある。またモンゴル文字は、文字の形が語頭・語中・語末で変化する。このふたつの特徴がモンゴル文字のコンピュータ化においても技術的なネックとなる。
 ワークショップには、ほかにもいくつかモンゴル文字のワープロやモンゴル文字表示用ソフトを開発したグループ、個人が参加していたが、どれも完成度が高いとは言いがたかった。そのなかではエルデネチメグさんらの「ソダルチ」はもっとも実用に近いものに思われた。当時はまだモンゴル文字を公用文字にする運動が熱気を持っており、モンゴル文字のコンピュータ化に対する彼らの意欲が強く感じられた。

モンゴル文字の復活
 現在モンゴル国で使用されているキリル文字の公用文字化は、1941年に決定された。その理由は「わが国の教育文化の発展は、ただソ連邦の人民との友好を深め、その豊かな文化を修得することによってのみなされる」とされた。中央アジアにあったソ連の共和国と同じように、モンゴルでもはじめはローマ字化が模索され、すぐにロシア文字化に転換されるという過程をたどっている。ロシア語にない2つの母音を表す2文字(ΘとY)を加えてモンゴル・キリル文字が作られた。モンゴル人のなかには自分たちの民族固有の文字を力ずくで奪われたという意識があったから、ソ連の支配が弱まるとモンゴル文字復活の動きが出てくるのは当然のことだった。
 1990年最初の自由選挙で選ばれた新政府は、1991年から1995年までの5年間をモンゴル文字とキリル文字の併用期間とし、1996年からモンゴル文字を公用文字とする決定をする。モンゴル文字ソフト開発者たちにも、この未来の市場において主導権を握ろうという野心があったのは間違いない。もちろん、モンゴル文字を一貫して使用している中国内モンゴルにも内モンゴル大学と北京大学が共同開発した「北大方正」というDTPソフトが存在していたが、入力が煩瑣などの欠点があり、新しいソフト開発の余地はじゅうぶんにあった。
 ところが、「民主化」という体制転換の一時期の熱が冷めると、モンゴル国会は当面キリル文字を公用文字として使用しつづけると1994年決定し、モンゴル文字は準公用文字の地位に後退することとなった。

モンゴル語コンピュータ処理の現状
 エルデネチメグさんに、DOS版「ソダルチ」のバージョンアップ版となるはずのWINDOWS版「ソダルチ」の開発についてうかがうと、TTFさえ作っていない段階でストップしたままだという。彼女の関心はもっぱら現在進められているモンゴル文字のISO案の作成にあるらしい。そのISO規格をもとに、UNICODEにモンゴル文字が含められることになるのだそうだ。
 ついでに、96年に制定されたモンゴル語用キリル文字のモンゴル国家規格(MNS)についても聞いてみた。この規格にはコードページが3種類ある。DOS用のもの(MNS4329-96)とWINDOWS用のもの(MNS4330-96)、それにマッキントッシュ用のもの(MNS4331-96)である。これらにキーボード・レイアウト(MNS4332-96)を加えて4つ一組の規格になっている。
 どうして3種類もコードページの規格があるのか知りたかったのだが、エルデネチメグさんは、キリル文字の問題はすでに解決済みで興味は全くないと言う。モンゴル語に必要なΘとYの2文字は、キリル文字セットISO 5427-1981の Extention Setに含められているからだ。

モンゴル文字のISO案
 モンゴル文字のISO案の作成は、モンゴル国立大学、モンゴル国立師範大学、モンゴル国家規格度量衡統一センター、中国の内モンゴル大学、国連大学などが参加して進められているという。その大きな特徴は、1Byteのコードページのなかにモンゴル文字、トド文字、マンジュ(満州)文字、シベ(錫伯)文字の4つを含めたことだ。
 トド文字とは、1648年西モンゴルの学僧ザヤパンディタ・ナムハイジャムソが、モンゴル文字を改良して作った文字である。
 マンジュ文字は万暦27年(1599)ヌルハチがモンゴル人エルデニとガガイに命じてモンゴル文字から作らせた。それを清代天聡6年(1632)になりダハイという人物が改良を加え、清朝でずっと使用されてきた。
 もうひとつの文字、シベ文字を使用するシベ人は、乾隆29年(1764)に盛京(現在の沈陽)から新疆のイリ川の南に移住させられた人々の子孫だ。彼らはマンジュ語系のシベ語を話し、文字もマンジュ文字を使ってきたが、1947年それにシベ語の特徴を反映した改良を加え、シベ文字を作った。
 このように、1枚のコードページに収まる4つの文字は、モンゴル文字とそれから派生した文字たちなのである。
 このコードページには、4種類の文字それぞれの、ひとつの音を表す文字の孤立形あるいは語頭形がひとつだけ割りふられてある。つまり文字の示す音と文字の形のあいだには、1対1の対応づけがなされている。これを”Basic Character Set”として情報伝達の規格として用いるという。言い換えれば、文字の音価を伝達するコードである。
 しかし、モンゴル文字をはじめとするこれらの文字は、ひとつの音を示す文字の形が語頭、語中、語末などで異なるから、表示と印刷には、語中形・語尾形を含む”Presentation Form”(フォントに相当する)を用いる。この文字形は、”Basic Character Set”のコードからアルゴリズムを通じて生成される1Byteのコードに対応している。4種の文字は大部分が共通した形を持つので1Byteにじゅうぶん収まる。音価のデータはこのアルゴリズムによって文字形のデータに変換されるのである。
 また、このアルゴリズムで生成できない不規則な変化形などは、”Basic Character Set”のコードにコントロール・コードを付加することによって生成させるという。このコントロール・コードには、語頭形・語中形・語尾形を示す”Position Selecter”、さらにそれぞれの形の中での変異形を示す”Varient Selecter”、語中のスペースを示す”Monglian Space”の3つがある。
 これら、”Basic Character Set”、アルゴリズム、コントロール・コードの3つの規格からモンゴル(トド・マンジュ・シベを含む)文字のISO規格は成り立つことになるという。

 エルデネチメグさんの話によると、現在の課題は、”Basic Character Set”によって構成されるテキストファイルの中で、ある文字の語中形を例示したい場合、それができないことだという。モンゴル文字ISO案の作成についての会議は、3ヶ月に1度の割合で行なわれているらしい。早ければ今年中にもISO最終案がまとまるかもしれない。しかし、現在のモンゴル国でのこの問題への関心の低さなどから考えると、国際標準規格ができモンゴル文字がUNICODEに含まれるようになったとしても、モンゴル国内での使用は学術研究など限られた分野にとどまる可能性が高い。

上村 明(かみむら あきら)
モンゴル地域文化研究専攻

モンゴルで突然ノートパソコンのHDDが止まった。しばらくするとまた動き出す。ウィルスに感染かと思い、ブートセクターなど保存しておいたものと置き換えたが、症状はそのまま。そして、春が来た。この「新種」のウィルスの正体が分かった。低い室温のせいでHDDが動作不良を起こしていたのだ。

(雑誌掲載の記事と若干異なります)

もどる