4月30日付けのBBC Newsは、アフリカのAI(人工知能)、特に自然言語処理への挑戦について報じている。今週、AI 分野において世界で最も大きいカンフェレンスの一つであるICLR (International Conference on Learning Representations)が、コロナの影響で物理的な実施を取りやめ、オンライン開催になった。これが特にアフリカの研究者にとって残念だったのは、今年の会場はエチオピアの首都アディスアベバであり、今回が初めてのアフリカ大陸での開催となる予定だったからだ。アメリカやカナダで行なわれるAIの学会に、アフリカの研究者がビザ問題で参加できず、国際的なAIの研究潮流から外れてしまうという問題は以前から指摘されていたが、今回のアフリカでの開催はそれに対応したものだったと言われている。
カンフェレンスには多くの発表があるが、Bonaventure Dossou氏とChris Emezue氏はベナンの言語であるフォン語をフランス語に翻訳するAI言語翻訳モデルFFRを発表する予定だった。フォン語は、アフリカの多くの言語のように、話し言葉であり書かれることはほとんど無い。つまり、この開発はアフリカのAIに共通した挑戦であるともいえる。
AIは生活を根本的に変える、第四次産業革命を推し進めるものとして注目を浴びている。そしてビッグデータはAIシステムに動力を供給するものとされる。しかし現在のところ、アフリカはAIを牽引するアクターとして見做されていない。その理由の一つは、アフリカ大陸の2000と見積もられる言語のほとんどが「少ない資源」としてカテゴリー化されているからだ。つまりそれらのデータが少ないか、利用可能な形での保存数が足りないのだ。現在アフリカの言語はボイスアシスタンスなどの自然言語処理アプリケーションを構築するときに考慮されることはない。
しかし、アフリカの研究者はそのハンデを埋めようと努めている。Masakhane(ズールー語で「一緒に築く」という意味)はアフリカの言語の機械翻訳を進めようとする研究ネットワークである。アフリカ20カ国に150人のメンバーがいて、翻訳に興味がある人であれば誰でもメンバーになれる。現在までのところMasakhane のメンバーは25のアフリカの言語の翻訳を行なったという。
また、 Ezeani博士は現在ナイジェリアのイボ語を英語にする機械翻訳に取り組んでいる。彼はこのように言っている。「5年から10年の間に、私はアレクサとイボ語や他のマイナー言語でやりとりすることが可能になると考えている。それは非常に大きな成果になるだろう」。
数が多く、話し言葉が主体であるというアフリカの言語状況の特色は、政治や教育に大きな影響を与えてきた。AIという、データ量が重要な意味を持つ技術を、この言語環境の中でどのように育てていくのか。今後の動きが注目される。