外国語教育学会 第6回大会
シンポジウム −外国語能力の評価法−


2002年12月14日 於 東京外国語大学

本ページの内容を引用される場合は、『外国語教育研究6』 外国語教育学会編、2003年、pp.69-101の出典を明記してください。 © 2003 外国語教育学会 (JAFLE)。




はじめに  在間 進

 本日はお忙しい中、外国語教育学会第6回大会にご参集いただきありがとうございます。本学の大学院地域文化研究科では、本年、21世紀COE 「言語運用を基盤とする言語情報学拠点」というプロジェクトが採択されました。外国語学と外国語教育が中心的な学術研究分野として認知されたことは、本学会にとってもたいへん喜ばしいことだと思います。
 私もドイツ語教育において、これまでいろいろと試行錯誤をしてまいりました。そんな私には夢が二つございます。ドイツ語の世界では、ドイツ語学習者の倍増計画を実現しようと考えております。高等教育を見直す中で、外国語と外国文化の再構築を行い、その教育水準を高めていきたいと思います。もう一つの夢は、ドイツ語の研究方法や教材を世界に輸出することです。科学技術の世界では、日本のものが世界中に広がっております。単に技術だけではなく、人文科学の分野でも日本のものを世界に輸出する必要があると思います。本日は皆様とともに外国語教育について考えてゆきたいと思います。

(東京外国語大学副学長)





基調講演 外国語教育と評価   伊藤 嘉一

 日本では外国語の教育といえば英語であるといった思い込みがありますが、私はそうであってはいけないと思います。私は英語帝国主義に抵抗を感じております。外国語は全て平等でなければなりません。また英語が世界中で使用できるわけでもありません。他の国のことが分からないから英語を使わざるを得ないという捕縄的な発想ではいけないと思います。英語グローバリズムによって各国の言語や文化がなくなってしまう、あるいは弱い立場になってしまうという危惧の念が世界中にあります。
 今、外国語教育において「評価」は注目の的になっています。一つには、評価の考え方を相対評価から絶対評価にしなくてはならないという文部科学省の通達があります。もう一つは、本年度から日本の小学校の全てにおいて英語教育活動ができるようになりました。ところが、小学校の英語教育は選択制でどのようなことをしてもよいため、その評価が非常に難しいのです。現在、英語教育を行っている小学校の実態を調査したところ、実際に評価を行っている小学校は42%しかありませんでした。評価の内容も、児童の自己評価が40%、先生のアンケート調査が30%、観察評価が20%、その他が10%です。評価は始まったばかりです。一番の問題は、教える内容がまちまちであるということです。学校によって格差が大きく、評価もまちまちの状態です。評価の内容が問題で、ほとんどの評価が学習内容を問う内容ではなくて、態度評価や情緒評価です。これらは外面的な評価で、本質的な評価にならないのではないかと思います。本質的な評価は学習評価でなければなりません。しかし学習の内容がはっきりしないため、小学校の英語教育の評価は難しいのです。また、小学校では国際理解教育の一環として英語を教えるため、国際理解の評価もしなくてはなりません。しかも、さらに総合的学習、つまり、生きる力を養う学習の評価もしなくてはいけないのです。
 小学校では国際的な言語としての外国語を知ること、そして日本語との違いを知ることが大切だと思います。外国とコミュニケーションをするために英語を学び、さらに他の外国語にも興味を持つようにしなくてはいけないと思います。外国語を通して、別の認識を持てるようにする機能が必要だと思います。それを評価にも反映しなくてはなりません。
 外国語と他の分野の評価の違いを考える必要もあります。芸術ではパフォーマンスや作品が、科学では科学的な認識法の習得が、医学では臨床的な結果などが評価に必要となるでしょう。外国語教育の評価には三つの観点、コミュニケーション・スキル、言語知識、異文化理解がポイントして考えられると思います。
 平成12年12月4日の文部科学省の教育課程審議会の公文書の中で、評価のポイントに6つの基準、すなわち、基礎基本(学習指導要領)の評価、相対評価から絶対評価への移行、個人内評価の導入、指導と評価の一体化、総合評価の導入、多様な評価のそれぞれがあげられています。
 これまではオーラルの評価が困難でした。その研究が最近では重要性を帯びてきました。機械を利用して、通じるか通じないかの判断ができるようになるのではないかと思います。書くことの評価も問題です。必要とされる文章が書ければよいので、日本語をすべて翻訳する必要はないと思います。要するに、これらの作業を通じて日本人にとって何が必要なのかを考えなければならないと思います。それがはっきり定まってこそ、評価が可能になるわけです。

(東京学芸大学名誉教授)
(原稿作成 横山 大、校正 黒澤 直俊、川口 裕司)




TUFS言語モジュール*     川口 裕司

はじめに

 今回のシンポジウムのテーマは「言語能力の評価法」である。そもそも言語能力とは何なのか。Competenceだけを指すのか、performanceまで含めた能力なのか。そして、その能力はどのような尺度で測られ、いかにして評価されるのか。おそらく様々な考え方があり、議論百出するテーマに違いない。そのような言語能力の定義と評価法をめぐる理論的な問題は、もちろん筆者の能力をはるかに超えた話題であり、言語評価の専門家の皆さんにお任せすることにして、ここでは筆者自身が関わっているプロジェクトを事例のひとつとして紹介するにとどめたい。
 昨年11月、文部科学省の21世紀COEプログラムに東京外国語大学大学院地域文化研究科が申請していた「言語運用を基盤とする言語情報学拠点」が採択された。その拠点形成において開発されるTUFS言語モジュールは、言語能力の評価を考えるうえで、いくつかの話題を提供してくれるように思う。以下では、その言語モジュールの概要を解説しつつ、プロジェクトの目的を知っていただくとともに、大方のご意見とご批判を仰ぐことにしたい。  

 この拠点形成においては、情報工学を基盤として言語教育学と言語学の統合がはかられる。こうして生み出される新たな学問領域は言語情報学と呼ばれる。たとえばコーパス言語学のように、コンピュータ科学と言語学が協働する分野や、近年注目されるe-learningなどは言語情報学の典型的な研究領域と言えよう。もちろん、このCOEプログラムからは、従来の言語学や言語教育学の研究成果も生み出される。しかし拠点形成の主たる目的は、言語情報学の創成によって、IT技術を駆使した外国語教育の先端化、シラバス論や談話分析の研究成果を活かした教育の効率化、言語理論を背景にした教育内容の高度化を実現することにある。そして、その成果が最も明確な形で現れるのがTUFS言語モジュールと呼ばれるWeb教材である。
 ところで、モジュール教材というと、言語教育学の中ではむしろ批判の対象になることが多いのだが、なぜこのCOEプログラムは今あえてモジュール教材を世に問おうとするのか。その疑問に答えておく必要があろう。

モジュール的言語観

 従来の言語学では、音韻・形態・語彙・統語という構成レベルは、いわば積み重なった階層を成し、言語構造は音韻から統語へ、あるいは逆に統語から音韻へと段階的に捉えられ、それぞれの構成レベルに規則ないしは文法があると考えられてきた。このような言語観を統合的言語観と呼ぶことにする。それに対してモジュール的言語観では状況が少し異なる。モジュール的言語観においては、音韻・語彙・文法・統語といった言語の構成要素は、それぞれがある程度自己完結的であり、互いに独立した構造をもちながらも、ハイパーリンクによって相互に緊密に関連づけられる。両者の違いをあえてイメージ化するならば前のページの図のようになるかもしれない。



 統合的言語観においては、階層化された構成レベルとそれらを関連づける規則や文法はふつう一度に提示される。換言すれば、規則や文法は必ず構成レベルとともに共起するのであり、それらは構成レベルと無関係には成立しえない。いわゆる統合型教材は、こうした統合的言語仮説に基づいていると思われる。統合型教材には学習者が構成レベルを容易に自覚できるという利点があるものの、他方で、参照あるいは関連する規則や文法ができるだけ近くにまとまって提示されなければならないという空間的制約がある。
 ところで、インターネットが急速に進歩し普及した現在、外国語教育においては、統合的言語観に代わってモジュール的言語観がますます重要になりつつあるように思える。モジュール的思考の利点は、教育者および学習者のニーズにあった内容を比較的自由に提供できる点にある。それぞれのモジュールがある程度の完結性と独立性をもつため、たとえば語彙や音声だけを学習したり、あるいは会話の中に現れる特定の機能だけを集中的に教育することが可能である。またハイパーリンク構造によって、モジュール間の関連性は、従来の統合的言語観におけるよりも、はるかに複雑な組み合わせとして提示できるようになり、さらに多様なニーズに対応可能となる。内容の修正や更新が容易なこともインターネットを利用したモジュール型教材の大きな特徴であると言えよう。とりわけ紙を媒体とする教材と比較した場合、この利点は計り知れないほど大きな意味を持っている。おそらく将来的には、教育者が自らの目的に合うようにモジュールを自由に組み合わせたり、学習者が自らのニーズに合った順序で学習することが可能になるであろう。そのとき旧来からの外国語教育における学習方略や指導要領は根本的な批判にさらされることになろう。

TUFS言語モジュール

 TUFS言語モジュールは発音・語彙・文法・会話の四モジュールから構成され、英語以外の言語は外国語を初めて学ぼうとする大学生を対象としている。このWeb教材には二つの特色がある。
 第一の特色としては、多言語システムという点があげられる。当初の計画では、17言語(英語、ドイツ語、フランス語、スペイン語、ポルトガル語、ロシア語、中国語、朝鮮語、モンゴル語、インドネシア語、フィリピノ語(タガログ語)、ラオス語、カンボジア語、ベトナム語、アラビア語、トルコ語、日本語)のWeb教材開発が予定されている。これにより、言語によっては世界初のWeb教材が誕生するものもある。
 第二の特色としてはフィードバックシステムがあげられる。Web上のモジュールは外国語教員ネットワークを通じて、実際に授業の中や副教材として利用され、その評価がフィードバックされ、それを受けてバージョン・アップが繰り返される。利用され評価されながら成長してゆく教材を開発できるのも、インターネット教材ならではの利点と言えよう。

学術的貢献と問題提起

 モジュール開発は基本的にそれまでの学術的研究をもとに行われる。たとえば会話モジュールは機能シラバスを土台にして作成され、発音モジュールは音声学や音韻論の成果を取り入れつつモジュールが製作されている。



 しかしながらTUFS言語モジュールが学術的に重要性をもつとすれば、それは先行研究との関連においてというよりは、むしろ多言語を視野に入れ、ある種の汎用性を意識してモジュール開発がなされている点にあるのではないだろうか。たとえばこれから開発されようとしている文法モジュールでは、文法の枠組みは類型論的な視点を取り入れつつ構築される。西洋語文法や日本語文法を下敷きにするのではなく、それはある種の汎用文法の可能性を模索する試みになろう。同様に会話モジュールのシラバスは40の日常会話の機能をもとに設計された。また語彙モジュールの開発では、多言語に共通する基礎語彙と個別言語に特有の文化語彙が区別される。このようにモジュールの開発には、ある程度通言語的な視点が生かされている。
 言語モジュールのある種の汎用性・通言語性を利用して、最終的に多言語に共通する言語能力の評価モデルが検討され、その有効性が検証されることになれば、それは学術的にも意味のある研究になるであろう。単一の言語ではなく、多言語にわたる言語能力を考える試みは、言語教育学や応用言語学の分野でもそれほど研究の蓄積があるわけではない。その意味で、汎用的言語能力評価モデルの探求は大変興味深い研究分野となるであろう。

モジュール開発の現状

 実を言うと、TUFS言語モジュールの開発計画は、21世紀COEプログラムの採択と同時に始まったわけではない。すでに2002年の春から文部科学省の科学研究費補助金の交付を受けて基礎研究が行われていた。21世紀COEの採択がなくとも、モジュール開発は粛々と進んでいた筈である。それがCOEの採択によって、教員と大学院生による総勢150余名からなる大きなプロジェクトに変身したのである。
 2002年11月から2003年1月にかけて、発音モジュールと会話モジュールの開発が行われた。2月からは各言語の録音と録画が始まり、2003年3月現在、12言語のモジュールのコンテンツがほぼ完成し、Web化のためのデザイン外注が行われ、開発はいよいよ最終段階に入った。筆者が当初抱いていた心配は、おおかた杞憂に終わった。モジュール開発に着手するや、大学院生たちは不断の努力をはらい、関係教員の精力的な協力もあって、開発作業は比較的順調に進んだのだった。2003年5月の下旬には、発音モジュールの第一版が公開され始め、実際にクラスの中や副教材として利用されるようになる。おそらく夏休み前には、会話モジュールの第一版の学内公開が始まるであろう。
 さらに詳しい内容については以下のURLをご覧いただきたい。http://www.coelang.tufs.ac.jp/index.html また、このCOEプログラムに関心を持たれる外国語教員の方、あるいはモジュール評価の作業にご興味のある教員と大学院生の方は、coelang@tufs.ac.jp にメールを送っていただきたい。皆さんからのご批判とご協力を切に期待している。

(東京外国語大学)

* TUFSは東京外国語大学(Tokyo University of Foreign Studies)の頭文字を表す。




TUFS言語モジュールにおける評価法の可能性について   和田 朋子

 東京外国語大学大学院の「言語運用を基盤とする言語情報学拠点」は、2002年11月に文部科学省の「21世紀COEプログラム」に採択されたプロジェクトの1つである。本プロジェクトでは主に、「TUFS言語モジュール」を基盤とする17言語汎用シラバスの作成が進んでいるが、本報告では、この「TUFS言語モジュール」における評価法について、その可能性を探るべく、いくつかの論点を挙げたいと思う。

「TUFS言語モジュール」の特徴

 「TUFS言語モジュール」における評価を考える際にポイントになることとして、本モジュールの特徴が2つ挙げられる。一つは、本モジュールが「モジュールシラバス」の形式をとっているということと、もう一つは、本モジュールは「WBT(Web-based Training)教材」として、具体的な教材化がなされるということである。
 「シラバス」とは、教えられるべき項目を選択し、配列したもの(Nunan, 1989)である。シラバスの分類にはいろいろなものがあるが、その中で、項目の配列の方法がSynthetic(統合的)であるのか、Analytic(分析的)であるのかということで分類を行う方法がある(Yalden, 1987)。Synthetic Syllabusでは、項目がある特定の順番にのって配列されており、学習者はシラバスに示された順番のとおりに学習を進めていくことが前提とされている。一方、Analytic Syllabusでは、項目の配列には順番は示されておらず、学習者は自らのコミュニケーション活動の必要に応じて、その都度、言語使用および言語形式を学ぶことが求められる。
 「TUFS言語モジュール」は、「会話モジュール」「発音モジュール」「文法モジュール」「語彙モジュール」の4つのモジュールから成る「モジュールシラバス」であり、これはAnalytic Syllabusに分類される。Analytic Syllabusを採用する利点としては、学習者の1)中間言語の発達段階、2)学習スタイル、3)必要としている言語における比重、の3点を中心に学習を進めることが可能になる点が挙げられる(Robinson, 2001)。つまり、学習者は自分のコミュニケーション上のニーズや好みの学習スタイルに合わせて、自分に最適の言語の学習プロセスを組み立てることができるのである。
 また、4つの各モジュールもanalyticな形式をとっており、学習項目はそれぞれ独立した形になっている。例えば、「発音モジュール実践編」においては、「サバイバルのためにこれだけは」「円滑なコミュニケーションのために」「ネイティブ並みの発音を身につけるために」という3つのレベルを設けてあるが、これはあくまでも学習者の学習ニーズの特定化をするために、分類を行っているに過ぎず、各レベルの中での学習項目は独立している。また、「会話モジュール」は、言語機能に焦点をあてた「機能シラバス」を採用しており、やはり各学習項目間に順序付けはない。
 「TUFS言語モジュール」は、Analytic Syllabusの形式をとることで、かなり柔軟性の高いシラバスとなった。このことは、本モジュールが17言語に汎用可能なシラバスであることを可能にする上で重要な意味を持っている。一方、発音モジュールにおいて、どのような項目がどのレベルで取り上げられるのか、また、会話モジュールの各言語機能で、どのような場面が取り上げられるのか、等は各言語によって異なるため、この点で、17言語に汎用可能なシラバスのなかで、各言語の異なった特色が明らかになることが期待される。
 一方、「モジュールシラバス」では学習項目の選択・順序付けに自由度が高いため、各項目の学習に必要もしくは関連した文法や機能の情報と、テキストや補助教材へのレファレンス情報が重要となることは、しばしば指摘されている点である(Shaw 1982)。たくさんの学習項目を目の前に提示されても、学習者はただ漠然と言語に直面することになる。つまり、さまざまなモジュールで示されている言語の「部品」が、体系的にどのような「機械」となるのか、どのように組み立てていけば「コミュニケーションの形になるのか」の「道しるべ」が必要になるわけであるが、この点で「TUFS言語モジュール」が、本モジュールのもう一つの特徴である「WBT教材」の形式をとっているということが意味を持つ。
 Chapelle(2001)は、WBT教材を含めたCALL(Computer-assisted Language Learning)は、Analytic Syllabusの特性を引き出す上で、非常に重要な概念であるとしている。CALL教材の最大の利点は、そのリンク性である。上でも述べたとおり、モジュールとして独立して提示されている学習項目は、何かで関連付けし、体系を持たせる必要がある。これを従来の紙ベースで行っても、ただ漠然としてしまうだろう。しかし、コンピューターの特性を生かし、各項目、各モジュールをリンクさせれば、視覚的に言語を体系化することが可能になる。コミュニケーションにおいて、各言語の「部品」がどのような役割を持つのか、どのような学習が必要であるのかを提示することができる。
 「TUFS言語モジュール」は、モジュールシラバスであるという「柔軟性」とWBT教材であるという「体系性」の2つの特徴により、学習者のニーズに合った、コミュニケーションを中心に考えた、17言語に汎用可能なシラバスであるということが言える。このことは、「TUFS言語モジュール」が、さまざまな学習モデルを提示することを可能にしているわけであるが、学習プロセスを経た後に行われる「評価」の段階でも、この2つの特徴は重要な意味を持つのである。

評価をマクロにとらえて:モジュールシラバスの観点から

 「TUFS言語モジュール」の評価方法の可能性を探るために、まずはモジュールシラバスという観点から考えてみたいと思う。「TUFS言語モジュール」では、そのモジュールシラバスの持つ柔軟性という特質により、学習する内容は学習者によって異なっている。つまり、学習者は「TUFS言語モジュール」で学習するにあたり、一人一人異なった通り道を経て、最終的な「評価」を迎えるのである。このように、学習者によって学習のプロセスが異なるということは、その一方で、「TUFS言語モジュール」という一つの学習プログラムとして、統一的な「出口」としての評価も必要であるということが言える。
 「モジュールシラバス」の持つ柔軟性という点では、一方、学習した内容が評価の方法に反映されることも重要であると考える。一般的な評価論の観点から、評価方法を考える際には、重要な点として1)評価(テスト)の目的、2)どのような言語が目標か(どのような文脈で言語が学習されているのか)、3)学習者のレベル、4)言語の何を評価するのか、等を考察する必要があるとされている(Bachman&Palmer, 1996)。つまり、「評価」とは、学習プロセスにおいて、どのような目的で、どのような学習がなされたのか、という一つの「道」をまとめる最後の出口として存在すると考えられているため、「評価方法」がどのようにあるべきか、ということは、学習者が言語を学習した目的および学習の状況によってすべて異なってくるのである。評価を「統一的な出口」として考えた場合でも、「個々の学習プロセスの最後の出口」と考えた場合でも、いずれにしても言えることは、「学習」と「評価」の結びつきをはっきりと示す必要があり、それは「TUFS言語モジュール」がモジュールシラバスであるからこそ、なおさらその必要性が高いのである。

評価をマクロにとらえて:WBT教材の観点から

 「学習」と「評価」の結びつきを考える際に、「TUFS言語モジュール」がWBT教材であるという観点が非常に重要になる。一つは学習者の学習ログの管理である。学習者が学習した内容を評価に結びつけるためには、学習者が何を学習したのかの履歴が必要となる。これは、WBT教材では「学習ログ」という形で管理され、個々の学習者の学習プロセスに適合した評価を行う際には、この学習ログをもとに評価が行われる。モジュールシラバスであるからこそ、その多様な学習プロセスに適合した評価が必要であり、それはWBT教材だからこそ、学習ログという形で可能になるのである。
 一方、モジュールシラバスであるからこそ、多様な学習プロセスの「統一的な出口」が必要である、という点を考えてみよう。個々の学習プロセスによって内容の異なるテストを実施する一方では、「TUFS言語モジュール」としての言語能力の評価のために、テストにおいて用いられる各テストアイテムが一次元的に能力を測定できるようにしなくてはならない。これは、現代の評価論では、項目応答理論(Item Response Theory)に基づいて行われている。項目応答理論により、各アイテムの難易度が特定され、テストがコンピューター上で行われた場合、学習者の能力に適合する形で、テストが実施されることが可能になっているのである。これをComputer Adaptive Testing(CAT)と呼んでいる(Dunkel, 1999; Chapelle, 2001)。このように、WBT教材であるという特性は、異なった学習プロセスを反映した評価を可能にしながらも、能力を一次元的に測定することを可能にするのである。

評価をミクロにとらえて:テストアイテムについて

 「評価」を行う際に重要なことは、学習者の言語使用を引き出すことである。学習者がある場面に直面した際に、言語を用いて、どのくらいその場面に対応することができるのかという、学習者の言語的反応(performance)を引き出すための刺激が「テストアイテム(問題)」である。そして、「評価」に用いられる「テスト」は、いくつかの「テストアイテム(問題)」から成り立っている。
 テストアイテムが学習者に求める言語使用は、学習者が最終的には言語を用いて何ができるようになっていなければいけないのかを示している。学習者は学習した知識を持ってテストに臨み、テストアイテムに正しく反応できた時点で、言語を使うことができた、つまり正しくコミュニケーション活動を行うことができた、ということを自覚することになる。また、正しく反応できなかった場合には、自分がこれから何を学ぶ必要があるのかを知ることになる。学習者は、WBT教材として、よりバーチャルなかたちで言語使用を引き出されることで、コミュニケーションを中心とした「評価」を受けることが可能になる。
 テストアイテムにおいて重要な要素としては、テストアイテムの1)概念的な複雑さ、2)難易度、3)形式および体裁、の3つが挙げられる(Skehan, 1998; Robinson, 2001 )。この要素を本モジュールに反映させて考えてみると、1)については、言語が用いられる文脈が挙げられる。言語は文脈なしでは存在しない。つまり、テストアイテムが求める言語使用においても、必ず文脈を提供する必要がある。これは、画面が動くWBT教材においては、実現が可能である。2)については、本モジュールがモジュールシラバスであること、そして、IRTを用いてCATの形式をとることも可能であることから、かなりの柔軟性を持たせ、「TUFS言語モジュール」としての特色を生かすことができるであろう。3)については、従来の紙ベースの評価では、なかなか多肢選択式の問題以外の形式をとることが難しかったのではあるが、本モジュールがWBT教材であることから、何か実際の具現化された問題形式が可能になるのではないか、という期待が寄せられる。
 このほかにも、モジュールシラバスの観点から、各シラバスの練習問題と、テストアイテムの関連付けや、WBT教材の観点から、テストアイテムをたくさん生成し、プールする(アイテムバンキング)など、「TUFS言語モジュール」における評価方法としては、さまざまな可能性が考えられる。

「TUFS言語モジュール」における評価法の可能性

 「TUFS言語モジュール」における評価法について考える出発点は、その「モジュールシラバス」という特性と「WBT教材」という特性にある。特に、評価において重要とされる「学習と評価の結びつき」については、モジュールシラバスの持つ柔軟性とWBT教材の持つ体系性が、大きな役割を持つことになる。また、評価が「何ができるようになったのか」「何ができるようになればいいのか」を示すステップであることから、個々のテストアイテムが、求められている言語使用を具現化することになるという可能性も見えてきた。コミュニケーションを中心とした、学習者中心の言語学習プログラムである「TUFS言語モジュール」が確立するなかで、その評価方法は、さまざまな可能性を秘めていると言ってよいだろう。

(東京外国語大学大学院博士後期課程)

参考文献
Bachman, L., & Palmer, A.(1996). Language testing in practice: developing and designing useful language tests. Oxford: Oxford University Press.
Chapelle, C. A.(2001). Computer applications in second language acquisition. Cambridge: Cambridge University Press.
Dunkel, P.(1999). Research and development of a computer-adaptive test of listening comprehension in the less commonly-taught language Hausa. In M. Chalhaub-Deville (ed.), Development and research in computer adaptive language testing (pp.91-121). Cambridge: University of Cambridge Examination Syndicate / Cambridge University Press.
Nunan, D.(1989). Designing tasks for the communicative classroom. Cambridge: Cambridge University Press.
Robinson, P.(2001). Cognition and second language instruction. Cambridge: Cambridge University Press.
Skehan, P.(1998). A cognitive approach to language learning. Oxford: Oxford University Press.
Yalden, J.(1987). Principles of course design for language teaching. Cambridge: Cambridge University Press.




TUFS言語モジュールにおける評価法の課題    根岸 雅史

1.評価法の確立の必要性

 TUFS言語モジュールというユニークなWBT教材が開発された。およそあらゆる学習教材には、その学習結果の評価が必要であり、その意味では、学習教材としてのTUFS言語モジュールも何らかの評価法が求められる。TUFS言語モジュールの大きな特徴は、そこで提供される言語の多様さであるが、このことは確立した言語テストを持たない言語の能力評価法の開発も意味する。これらの言語を含むTUFS言語モジュールの評価システムには、どのような課題が予想されるのであろうか。

2.評価法決定における選択肢

 TUFS言語モジュールは、ネット上での言語学習を想定している、いわゆるCALL(コンピュータによる学習支援システム)である。現在はこのシステムの設計は「どこからでも始められ、いつでもやめられる」ようになっている。このような自由な設計は、多様な学習者に対して適したものであり、それぞれの学習者のネット環境を考えると必須ですらある。
 当然のことながら、この便利な学習システムの設計は、学習者ごとに異なる「学習の多様な道筋」を生み出すことになる。しかし、このことは同時にモジュールの学習評価のためのテスト・デザインを非常に難しいものにすることを意味する。評価を大きく二つに分けた場合、学習の途中で行う「形成的評価」と学習プログラムの終えた後に行う「総括的評価」が考えられる。学習の「道筋」が異なるということを考慮すると、評価は「総括的」に行えばよいのであるが、このTUFS言語モジュールでは、厄介なことに学習を途中でやめる可能性もあるのである。こうなってしまうと、学習者全員に統一の総括的テストを行うことはできない。となると、学習者の「道筋」に合わせた学習者個人個人で異なるテイラード・テストの開発となるが、この開発にも問題が予想される。この場合、それぞれの学習ユニットに対応するテスト問題を用意しておくことになるが、学習者の学習の道筋が同一ではないために、その学習者にとっての「既習事項」を特定できないのである。そのために、新たに学習した事項の習得の成否をみる問題を作ることは不可能に近くなる。ましてや、このようなテストの開発を自動化することはできない。
 そこで、私たちに残されたオプションは二つある。ひとつは、学習プログラムの完全な自由化をあきらめ、あらかじめ決められたいくつかの大きなセクションを作っておき、評価はそのセクションごとに行うようにすることである。ただし、この場合も、一つのセクションが終わらなければ、評価を行うことはできない。もうひとつのオプションは、評価を「形成的に」行わずに、「総括的に」のみ行うという方法だ。つまり、学習プログラム上は、どのようなやり方もできるが、評価は学習プログラムが終了するまでは行わないことになる。このオプションは、これまでに作り上げてきた学習プログラムの変更をせずにすむという点で魅力的であるが、学習者へのフィードバックが学習が終了するまでなされないという点が問題となる。もちろん、それぞれの学習ユニットの中で適切にフィードバックがなされていれば問題ないかもしれないが、システマティックな形でのフィードバックは期待できない。

3.評価法の問題点の整理

 TUFS言語モジュールにおける評価法では、いつ誰にどのような結果のフィードバックを行うかが問題となる。学習プログラムの途中段階にある場合は、学習者に対して、学習結果の診断的な情報が必要になり、TUFS言語モジュールでは、フィードバックは必然的に言語のユニットに基づく情報となると考えられる。それに対して、学習プログラム終了時では、学習を終了した学習者自身への学習結果に関するフィードバックと同時に、学習結果に関するいわば「外」向きの情報も必要である。つまり、TUFS言語モジュールを終えた学習者が、その言語を使ってどのようなことができるのかに関する、社会に向けた説明である。この説明は、TUFS言語モジュールのうちのどの部分を修了したかというようなものは、「外」のものには意味不明であろうし、言語のユニットに基づく記述もその言語に精通していないものにとっては、理解が困難である。おそらく、「外」のものが求める能力記述の形は、実際のコミュニケーション場面で何ができて何ができないかに関する記述ではないだろうか。
 ややわき道にそれるが、「TOEICやTOEFLで何点である」とか、「英検で〜級」であるとか、「偏差値が〜である」とかといった能力記述は、実は、いずれも学習者個人を他者との相対的比較により理解したり、英語力をいわば量的に把握しようとしたりしているものである。これらのアプローチからは、個人が何ができて何ができないというようなことは見えてこないことを認識すべきである。そして、TUFS独自のレベル認定においても、この種の能力記述の特性を認識しておくべきであろう。とりわけ学習者数の少ない言語においては、学習者集団の中での相対的な比較はほとんど意味がない。
 その意味では、TUFS言語モジュールのうち言語機能(language function)に関する記述は、一般の人々から理解が得られやすい形であろう。たとえば、「挨拶ができる」とか、「ものをたのむことができる」とか、「何かを定義できる」という具合である。したがって、これをベースにした言語能力の記述を行うことも一つの選択肢であろう。
 これに関連して、近年は言語能力の記述において、いくつかの革新的な取り組みがなされてきている。外国語学習の段階を追って、それぞれの段階での能力を具体的に記述しようという動きは、ACTFL (American Council on the Teaching of Foreign Languages) Proficiency Guidelinesを始めとして、世界各地で起きてきている。ACTFL Proficiency Guidelinesの他には、FSI (Foreign Service Institute) ScalesやASLPR (Australian Second Language Ratings)、Canadian Language Benchmarks、the Common European Frameworkなどが代表的である(Davies et al. 1999等参照)。また、学習場面に基づいたthe British National Language Standardsなどもある(North, 2000)。これらのアプローチでは、直接的測定やreal-life performance testingによって判断がなされるという点が共通している。つまり、受験者が実生活で実行することが求められるタスクをやらせてみて、それを元にして能力を記述するのである。その結果のフィードバックでは、すべての学習者はほぼ同一の学習段階を経て、様々なことができるようになっていくという想定(holistic-universal view of proficiency)に基づき、実際にテスト場面で観察しなかったことも、記述されている(Davies et al. 1999)。しかしながら、これは実証的なデータに裏付けられたものではなく、一種の経験主義によるものである。
 TUFS言語モジュールの外向けの能力記述では、会話モジュールにおける言語機能に基づいた記述を超えて、現実の生活に基づいたタスク(real life task)の記述になっている必要があるのではないだろうか。たとえば、「レストランで食事ができる」とか「工場で作業の指示が出せる」というような能力記述は一般の人々にもわかりやすい形であると思われる。そして、このような記述の有り様は、その能力記述がどのような人々に向けられているかによっている。カナダやオーストラリアのような国々では英語は第二言語であり、教室を一歩踏み出せば、英語がコミュニケーションの道具として用いられている。これらの国における英語の言語能力記述は、一般に職業場面や生活場面に基づくものが多い。それに対して、英国のthe British National Language Standardsは、英国内で「外国語」として教えられている言語の能力記述であるためか、「教室内の学習場面」に基づくものが多い。
 ただし、実際にはひとつのタスクの遂行は、複合的な言語機能の使用および現実の「生活能力」が複合的に絡み合って実現するということを認識しておく必要があろう。上述の「レストランで食事をする」というタスクも「ウエイターを呼ぶ」「メニューを読む」「メニューについて質問する」「食事を注文する」などという言語機能のほかに、その言語コミュニティーにおける「料理に関する知識がある」「チップの払い方を知っている」「勘定の払い方を知っている」というような「生活能力」も関わっている。しかし、このような複合的な能力や知識から構成されるreal life taskは、多様な道筋が用意された学習プログラムにあっては、評価手段としてはやや使いづらいものかもしれない。それは、あるタスク遂行に必要な何種類もの能力や知識のうちたった一つの能力や知識の欠如のために、そのタスクが遂行されないということもあり得るからである。これは、言語をベースとした学習プログラムの診断的な評価としては都合が悪いのである。

4.問題解決に向けて

 TUFS言語モジュールにおける評価方法を確立するにあたり、私たちは様々なジレンマに直面している。このジレンマから抜け出すためには、おそらく「内向け」の評価と「外向け」の評価を分ける必要があるのではないだろうか。「内向け」の評価では、いくつかのセクションごとに学習プログラムの区切りをつけ、それぞれのセクションの終了時に、プログラムの構成に基づいた(つまり、言語モジュールに基づいた)診断的な評価を下すことである。それに対して、「外向け」の評価では、すべてのプログラムの学習が終了した時点で、総括的に評価を行うのである。そして、この「外向け」の評価では、一般人にもわかりやすい形での、現実的な生活場面に基づいた能力記述を目指すべきであろう。ただし、どのような生活場面が現実的なものと認識されるかを知るためには、TUFS言語モジュールの学習者のニーズ分析が必要である。つまり、なぜその言語を学習し、どのような場面でどのようなことにそれを利用しようとしているのかがわからなければならない。
 このような「現実的な生活場面に基づいた能力記述」を行う方法としては、ニーズ分析により特定されたreal life taskを実際に学習者にやらせてみることが考えられるが、この方法では、実際にやらせたタスクに関してしか、能力を記述することができないという問題点がある。また、上に述べたようなタスクの複合性の問題もある。これらの問題点を解決するには、能力の絶対値を示すようなスコア(例えば、項目応答理論から導かれるスコアなど)をテストにより得て、そのスコアとタスクの遂行能力を結びつけることである。ただし、こうしたフィードバックを可能とするためには、テスト・スコアと言語パフォーマンスを結びつけるための実証的なデータとその分析が必要となる(この点に関する具体的な作業手順に関しては根岸(2001)を参照)。このようにして、あるテスト・スコアの受験者が実際に何ができるのかを調べることができれば、今度はそのテスト・スコアから、TUFS言語モジュールの修了者ができるはずのことを予測できると考えられる。

(東京外国語大学)

参考文献
根岸雅史.(2001).「Can-doリストの開発−そのプロセスと展望−」『英語教育開発研究所研究紀要』第3号.英語教育開発研究所, 22-29.
Davies, A., A. Brown, C. Elder, K. Hill, T. Lumley, and T. McNamara (1999). Dictionary of Language Testing. Cambridge: Cambridge University Press.
North, B. (2000). The Development of a Common Framework Scale of Language. New York: Peter Lang Publishing.




外国語教育における評価とは?    馬場 哲生

1. 言語能力の客観的測定は可能か

1.1.  言語能力を「測定」することの意味

1.1.1.「測定」と「評価」の一般的意味
 「測定」とは、一般に、比較的限定された事象(長さ、時間、温度、重量など)を、客観的な手段(機械や道具)を用いて、客観的な間隔尺度(メートルや秒)によって数値化して表示することを意味する。真の値はただ1つしか存在せず、同一事象に対して複数の異なる測定結果がある場合には、測定誤差によるものと考えられる。
 一方、「評価」とは、一般に、事象の善悪・美醜・優劣などについて価値判断を下すことである。正しい評価値を客観的・唯一的に同定・特定することは不可能であり、同一事象に対して複数の異なる評価結果がある場合には、評価者の価値観や主観の違いによるものと考えられる。評価の妥当性を判断するためには、権威(専門家による判断)と間主観性 (より多くの人の主観に合致する判断) に頼らざるを得ない。

1.1.2. 言語能力の「測定」の特質
 能力を「測定」することは可能であろうか。別の言い方をすれば、能力を客観的に数量表示することは可能であろうか。この問いに対する解答を得るために、本項では次の視点から言語能力測定の性格について考察を加える。
  1) 測定対象
  2) タスクと採点基準
  3) 採点者の主観
  4) 要素の重み付け

1.1.2.1. 測定対象
 言語能力とは何か、また、言語能力を構成する要素は何かを特定することは困難である。様々な分類が可能であり、また、分類を細かくしていけば、下位能力を際限なく設定できてしまう。
 たとえば、「言語能力」の下位能力として「スピーキング能力」を設定した場合、その中の下位能力のひとつとして「発音能力」を設定することが可能だろう。「発音能力」の中には、音素を正確に発音する能力のほか、超分節 (suprasegmentals)・プロソディ (prosody) において正確なパフォーマンスを行う能力も含まれるため、これらを発音能力の下位能力とみなすことが可能である。この中で、「音素を正確に発音する能力」を取り上げて見ると、その要素として、「音素 /s/ の発音能力」「音素 /z/ の発音能力」というように、個々の音素ごとに発音能力を設定することもできてしまう。
 能力が際限なく細分化されてしまうという問題を回避し、一定の基準のもとで能力を特定するにはどうしたらよいだろうか。解決策としては、@因子分析などの手法を用いて下位能力の存在を統計的に特定する方法と、A人間の言語処理メカニズムを心理学的・生理学的に解明する方法が考えられる。
 @の統計的アプローチでは、あるタスクAができる人と別のタスクBができる人がほとんど重複している場合には、AとBを行う能力は同一のものであると見なされ、AはできてもBができない (あるいはその逆の) 事例が多い場合には、両者は別能力であると見なされる。一方、Aの認知心理学や脳生理学の研究が進めば、言語処理のメカニズムが明らかになり、言語処理の各段階における能力を設定することが可能になるかもしれない。例えば、読解においては、文字認識、単語認識、構文解析、意味解析、推測と検証などの処理が行われることが明らかになっている。それぞれの処理を司る脳の部位をもとに能力を設定することも可能かも知れない。また、それぞれの段階における言語処理能力の相互作用として、「総合的読解力」といったものを想定することもできるだろう。
 しかしながら、現在のところ、言語能力がどのような要素で構成されるかについてのコンセンサスはまだないと言ってよいだろう。さまざまな下位能力が提案され、修正されてきたが、それぞれの下位能力と上位能力との関係や、下位能力同士の関係についてはわかっていないことが多いのが実情である。

1.1.2.2. タスクと採点基準
 ある学習者の言語能力を知ろうとするとき、能力そのものを直接見ることはできないので、能力判定は学習者の行動 (performance) を通して行うことになるが、どのような測定手段 (タスク) と測定尺度 (採点基準) を用いれば言語能力を正しく知ることができるかということについて、見解の一致は見られていない。「どのようなことができたら、どのレベルの言語能力があると言えるか」という判断は、結局のところ判定者の価値観――言語能力において何を重視するか――によって決まるものである。

1.1.2.3. 採点者の主観
 学習者の言語行動についての優劣判定は、客観的な基準では決められる部分とそうでない部分がある。特に、スピーキングやライティングなどの産出 (production) に関する能力の測定においては、優劣に関する主観的判断が不可避である。産出技能の中でも、発音、文法、語彙選択の優劣などについてはある程度客観的に判断できるかもしれないが、論の展開の仕方や話のうまさについての判断は、採点者の主観にゆだねられる部分が多いと言えるだろう。こうした主観は、個人によって、文化圏によって、そして時代によっても異なってくる可能性がある。また、評価対象が何であれ、非常に優れている場合と非常に劣っている場合の判定には採点者間の一致が見られても、中間段階の判定は割れるということがあるだろう。

1.1.2.4. 要素の重み付け
 言語能力の測定においては、いくつかの下位能力をテストし、その結果を測定値として数量化し、それぞれの測定値を単一尺度にして表すことが多い。たとえば、TOEFLにおいては、学習者の英語力の下位能力として、リスニング、文法、リーディングの能力を測定し、さらに全ての測定値を一本化してひとつの得点で表している。また、スピーチ・コンテストの採点では、それぞれのスピーチを発音、文法、構成、内容などの観点から採点し、それぞれの観点における数値を合計する方法が採られることが多い。
 それぞれの項目にどの程度の重み付けをすべきだろうか。また、どのような計算式によって総合的な能力を算出すればよいのだろうか。これらは、テスト製作者や採点者の恣意性と価値観に大きく影響されると言ってよいだろう。たとえば、TOEICにおいては、200問中100問がリスニング問題になっているが、リスニング能力が英語力のちょうど半分を占めるという客観的根拠があるとは言えないだろう。
 こうした事情は、商品やサービスの評価で行われる「総合点」算出に似ている。例えば、自動車の性能を点数化して表そうとする場合、スピード、パワー、ハンドリング、ブレーキ、乗り心地、衝突安全性、燃費、スペースなどが判断材料になる。同様に、ホテルの評価の際には、立地の利便性、周辺環境、客室、調度品、レストランなどの付帯施設、チェックイン・チェックアウト時間、従業員の配置、接客の質など様々な要素が判断材料になるだろう。これらの事例では、個々の項目において客観的測定が不可能なものが多いうえ、どの項目を重視するかによって総合点による順位は大きく入れ替わってくる。この現象は、言語能力の測定においても起こりうることである。

1.1.3. 言語能力の「測定」は可能か

 言語能力の指標において、比較的高い客観性が確保されているものは、語彙サイズや読解速度などのように限定的なものである。言語能力の「測定」は、長さ・時間・速度・重量・温度などの測定とは性質を異にするものであり、@測定対象の設定、Aタスク・採点基準の設定、B産出技能の採点、C要素の重み付け、という様々な局面で測定者の主観的判断が不可避であるという性格を持っている。言語能力の「測定」においては、客観的・唯一的に同定されうる真の値というものは存在しない。測定者の価値観から自由でありえないという意味では、言語能力は、「測定」の対象としてではなく、むしろ「評価」の対象としてとらえるべきものであると言えるだろう。言語能力の「測定値」とは、「評価」の対象である言語能力に対して「測定」の手続きを援用して得た値である。

2. 外国語習得における発達段階の特定化は可能か

 言語発達の過程で、すべての下位能力が比例して向上していくとは言えないし、その割合がすべての学習者において同じであるとも言えない。その意味で、少なくとも単一尺度で発達段階を特定化するのは困難である。
 しかし、ある側面に限定すれば、発達段階の特定化ならびに多言語間共通の尺度の設定は可能かもしれない。
 文法処理能力の発達については、Pienemann (1998) の「処理可能性」(processability) の理論が有力候補と言えるだろう。Pienemannによると、文法処理能力には、発達的素性(developmental features: 普遍的な習得順序のあるもの)と非発達的素性 (non-developmental features: 学習者によって習得の時期が異なるもの) がある。発達的素性としては基本的な語順操作、非発達的素性としてはbe動詞などがある。発達的素性については、ドイツ語・英語などにおいて理論に基づいた発達段階の仮説設定とその検証が進められている。以下に英語の例を示すが、様々な言語について発達段階が解明されていけば、多言語間共通の言語発達評価尺度 (common scale) に利用できる可能性を秘めている。

第1段階
 □ 単語や、単語と同じようなレベルでひとかたまりで丸暗記している句、節や文。   例: "Yes." "in Vietnam."
                 "How are you?"
           "My name is X."

第2段階
 □ SVO (ただし、ここで言うOは学校文法で『目的語』に分類されるものより広範囲なものも含む。前置詞句や補語などもOに含まれる。)
    例: "I eat rice."
 □ 複数形の -s 例: books
 □ SVO? (平叙文の末尾のイントネーションを上げる疑問文)
          例: "You like Chinese food?"

第3段階
 □ Do前置 (この段階ではdoの文法的活用はできない。)
          例: "Do he work?"
 □ 副詞前置   例: "Yesterday I work."
 □ トピック前置 例: "Beer I like."
 □ don't+V 例: "I don't remember."

第4段階
 □ 疑似倒置 (wh疑問文の場合)
          例: "Where is the station?"
 □ yes / no倒置
   例: "Have you (a) car?"
 □ 不定詞 例: "I want to go."

第5段階
 □ 三人称単数の -s 例: "He works in a factory."
 □ do 第2位置
          例: "He did not understand."

第6段階
 □ 付加疑問文 例: "She works, doesn't she?"
 □ 副詞挿入 例: "I can often come home."

 Pienemannの仮説が外国語教育に与える重要な示唆は、それが単に普遍的な発達段階を示しているだけでなく、@発達的素性の産出技能 (production) の指導においては、学習者がその項目を習得するための準備段階 (readiness) が整っているときに限って、習得が促進されること、A発達段階を超えた指導は使用回避 (avoidance) などの悪影響を及ぼすこと、を示している点にある。
 この仮説の妥当性はもちろん完全に立証されたわけではなく、今後さらなる検証が必要である。しかし、言語処理の習得には脳のメカニズムに依拠した普遍性があるため、指導されたことを指導された順に身につけていくとは限らないこと、そして発達段階を超えた言語操作を強要すると悪影響さえありうること、これらの指摘は英語教育に対して大きな示唆を与えるものである。この理論が正しければ、言語教育においては個々の学習者の発達段階を診断した上での個別指導が必要不可欠になる。また、指導において、理解のための文法と発話のための文法を峻別すること、誤りへの対応に際して学習者の発達段階を考慮する必要が出てくるだろう。

(東京学芸大学)

参考文献
Pienemann, Manfred (1998).
Language Processing and Second Language Development: Processability Theory. John Benjamins Publishing Company. Amsterdam/Philadelphia
Bachman, Lyle F. (1990)
Fundamental Considerations in Language Testing Oxford University Press. Oxford
大友賢二監修/中村洋一著 (2002)
『テストで言語能力は測れるか 〜言語テストデータ分析入門〜』 桐原書店. 東京




ベトナム語―教授頻度の低い言語―の教育と評価   田原 洋樹

1.はじめに

 英語やフランス語、ドイツ語など外国語としての教授頻度の高い言語には、学習者の能力を測定する試験システムが整っている。他方で、昨今の「アジアブーム」を反映しているのか、学習者の増加を見ている(とはいえ、依然として教授頻度が低い)アジア系諸語には、能力測定試験が未整備である言語も多い。
 そこで本稿では、こうした教授頻度の低い言語であるベトナム語の講義を担当した経験と問題意識を踏まえて、教育と評価にかかわる問題点を明らかにする。

2.ベトナム語−能力測定試験がない言語−の教育と評価

 筆者が勤務する大学では日本語・英語の他に、アジア太平洋地域の言語教育科目として中国語、インドネシア・マレーシア語、韓国語、スペイン語、タイ語、ベトナム語が開講されている。この7言語6科目は、3ないし4(中国語・韓国語)のレベルに分けられ、初習者はレベルTから学習を開始し、既習者についてはその能力に応じ、下位レベルを履修免除にしている。履修免除の目安として、能力測定試験の結果を利用し、担当者による面接も合わせて実施している。
 7言語の中で唯一能力測定試験がないのがベトナム語である。日本国内のみならず、ベトナム本国にも「外国語としてのベトナム語」能力を示す基準はない。つまり、学習者は自分のベトナム語能力を証明する情報を持つこと、他者に提示することが出来ないのである。具体的には、履修免除の問題(今のところ発生していないが、今後あり得る問題)、さらに就職活動上の問題が生じる。他の言語であれば、就職活動のエントリーシートに特技として「X語。検定試験Y級」と書くことが出来るのに、という不満を聞くことが多い。またベトナム留学に際して奨学金を申請するので、ベトナム語の能力を証明する書類が必要になり、学生が相談に来るケースがあった。実際のところ、仮にベトナム語検定、あるいは何らかの統一基準でY級、Z点といっても、それは能力を点数化した「目安」に過ぎない。むしろ、講義を担当した教師による書状の方がより具体的に「どういう能力があるのか」を示すこともある。
 従って、筆者は、学習者のベトナム語能力を社会に対して明らかにし得る講義を提供すべく工夫を重ねてきた。昨今よく耳にする「アカウンタビリティー」を、日々の講義、学習者の成績評価において保証するということである。今日の講義は何を目標にしているのか、1学期履修すると何が身に付くのか、何が出来るようになるのか、何故この評価なのかを明示することである。受講者に明示し、あわせてWEB上で情報公開をした。「アカウンタビリティー」保証の鍵となるのは、日々の教育実践上の細かい工夫・仕掛けである。そして、学的根拠に立てる教育を行なうための理論研究である。
 こうした取り組みは多くの外国語教師によってなされているが、今後の議論のたたき台として、筆者の工夫を以下に挙げておく。

(1)講義目標と計画の明示
 日本の大学でも「シラバス」という語が定着しつつある。が、その中身は、北米などの大学での「シラバス」からは著しく離れている場合が多い。学習者に対して、開講方針や講義目標を事前に、そして具体的に示さなければならない。そして、学習に対する評価(評価のための各種テストも)は、この講義目標を達成したか否かに基づくべきである。
 そこで筆者が担当する科目では、1セメスター学習した後に何が出来るようになるのかを具体的に、「ベトナム語運用能力が習得できる」ではなく、「現地で生活を立ち上げ、身の回りの用事が自分で出来るようになる」や「ベトナム語で歌が歌え、映画を字幕・吹き替えなしで理解できるようになる」と明示している。このゴールに対して、1セメスター・14週間でいかに迫っていくか、週毎(毎週4コマ開講)の講義計画を示した。学習者は14週間全体での自分の「位置」を常に意識でき、また講義担当者は学習者に対する「公約」である講義目標の達成に向け、進捗状況を自己点検できる。講義計画の中にはセメスター途中で実施する中間的課題(筆者の講義では2回のまとめテスト)に日程、出題内容も示した。
 学習者は時に「学習する理由」を求める。例えば講義中に映画を上映すると、何故この映画を上映するのか、この映画を見ると何の能力が付くのかという質問をぶつけて来る。注意すべき台詞とその背景、映画の物語自体が持つ文化的意義を説明し、こちらは単なる時間潰しではないこと(当然だが)を明確にしておく。学習している文法事項、語彙が実際の言語生活の中でどういう役割を持つかを説明する、つまり「森を見せる」と、学習者はとかく単調になりがちな入門期の学習にも意義を見出すようである。
 教育は師弟の信頼関係の上に成り立つ、と言われるが、筆者自身も信頼に足るような講義を提供しているか内省の毎日である。
(2)クラス運営
 筆者が担当するのはいずれも受講生15名前後の小規模クラスである。発音や会話の練習などのペアワークが多くなることから、受講生間に友好的な雰囲気が醸成できるように努めると共に、疑問点を個別に解決できるように毎週オフィスアワーを設けて、受講生に対応した。いわゆる「第2外国語」扱いのベトナム語であるが、合宿や学園祭への模擬店(ベトナムコーヒー)出店など、教室外での活動にも力を入れた。これは受講生の積極性と素直さに負うところ大であるが、こうした活動を通じて、「恥ずかしさ」の壁を破り、自然に声が出るクラスが出来上がっている。
 また学期途中には面接を実施している。小規模クラスとはいえ、受講生全員の学習状況を講義時間内のみで把握するのは困難である。15分程度の面談ではあるが、つまづいている箇所を見つけて個々に対策を講じてあげると、学期途中での「脱落」は防ぐことが出来る。
(3)講義目標に即した評価
 学習者の評価は、講義目標への到達度によって行なう。筆者には若林・根岸両先生のご著作「無責任なテストがおちこぼれを作る」がテスト作成のバイブルである。講義と試験の適切な関係を常に心がけている。
 学習者は「評価の根拠・理由」を求めてくることがある。筆者の勤務校では、成績疑義照会期間が設定されている。講義担当者は評価の理由を示さなければならない。蓋し当然のことである。 
 筆者の観察によると、学生は「良く評価されたい」よりは「正しく評価されたい」傾向にある。「公平に扱われたい」という欲求にも繋がっている。従って「オマケ」や「お情け」込みの評価をすると、学生当人から感謝されることもなく、逆に他の学習者から抗議および担当者への信頼度や評価の正当性まで疑われ、文字通り四面楚歌になってしまう。
 さらに、後述するように、評価は「教員→学生」の一方通行ではなく、受講生による講義評価も合わせて論じるべきである。評価に関する議論で、依然として「教師→学生」の視点しかないものに接することが間々あって、落胆する。

 振り返ると、これは非常に「贅沢な」教育で、「贅沢な」評価方法である。評価は、個別学習者の成長をつぶさに観察し、「何が」「どこまで」出来るのかを具体的に示している。手間がかかるが、教育が人間による人間のための営みであることを考えると、決して軽視できない教育と評価の本質が、ここにある。
 他方で、学習者の評価を利用する立場からすると、能力を点数化した「目安」やより大きな判断基準が必要になろう。東京外国語大学大学院が今次開発しているTUFS言語モジュールの優れた特長のひとつは、通言語的視点がモジュール開発を貫いており、その評価も単にベトナム語、あるいはX語で「何が」「どこまで」出来るのかを示すにとどまらず、他の言語ではどのレベルに相当するのかをある程度正確に推測させる点である。言い換えれば、教授頻度が低いベトナム語という、いわば縦穴の中での評価にとどまらず、モジュール化された17言語が集う外国語の広場で、ベトナム語能力が明らかになるのである。TUFS言語モジュールによってモジュール化された教材、それに基づく評価は、従前「中の様子がよく見えなかった」教授頻度の低い言語を、通言語的視点という光を当てることにより、言語学的にも言語教育学的にも一層興味深いものにした。同時に、日々の教育や評価は通言語的・汎用性の観点からも厳しく精査されることになり、これに携わる者として、筆者も武者震いに似た心地よい緊張感を味わっているところである。

3.「評価」は師弟双方の努力で

 「外国語教育における評価」に関して、「評価」とは教師が学習者を評価する一面だけでなく、学習者が教師を評価する、いわゆる授業評価や教員評価についても考察を巡らせなければならない。
 筆者の本務校では2000年春の開学当初から、開講科目全てにおいて受講生による授業評価アンケートを実施している。結果は講義担当者へ文書で報告されるほか、WEB上でも公開されている。さらに、04年度からは教員勤務について、研究・教育・学内行政の3点から評価し、これを賞与査定や昇任審査の資料に用いる計画がある。目下学内で活発な議論が行なわれているが、筆者は「当然の流れ」と受け止めている。より良い教育を行なった者がより高く評価されるのは当然ではないか。ポイントは、学習者評価と近似しているのだが、いかにして正しく評価するか(評価されるのか)であろう。例えば、講義担当者への評価は小規模クラスで高くなりがちである。大規模クラスで、しかも視聴覚教材をあまり使用せずに、いわゆる「伝統的」スタイルで講義を行なうと評価は低く出る。科目ごとの特性を加味しつつ、講義担当者の講義能力および講義の「品質」を正しく評価するシステムの構築は、これからもさまざまな議論を呼び起こすであろうが、大学教育に携わる全ての者の課題であろう。
 先日、02年度秋セメスターに開講したベトナム語U(週4コマ開講。4単位)2クラスのアンケート結果が返却された。いわば「先生の通信簿」である。筆者は受講生に対してアンケートの重要性を幾度も説いた。「学生が自分の成績に疑義照会出来ても、教員にはそれが出来ない。だから、疑義が生じないように、正しく回答せよ」と、評価することの難しさを共有するように努めた。実は、授業評価アンケート自体は受講生にさほどメリットがない。セメスター最終週に実施し、たとえ担当者および教育内容に不満があって、それをアンケートにぶつけても、反映されるのは次セメスター以降である。「教育力ある」大学を作り上げるために、師弟双方が努力しているのである。
 
4.まとめ

 「良く評価されたい」から「正しく評価されたい」という流れの中、TUFS言語モジュールは正しい評価のあり方に対する大きな学問的挑戦である。学習目標・内容を洗いざらいにして、モジュールとして再構築している点と外国語能力の評価問題を切り離さずに、表裏一体の関係で捉えて議論しているのが優れている。この2つの研究が相互補完的に進展し、外国語運用能力の評価の通言語的な「スタンダード」が生まれることになれば、外国語教育に携わる者として、非常に心強いのである。

(立命館アジア太平洋大学)




自由討論

黒澤: 報告者の皆さん、ありがとうございました。では引き続き自由討論に入りたいと思います。本日の報告には外国語教育における評価という問題の他に大学教育と評価をめぐる他の様々な問題が含まれていたと思いますが、まず、ご質問やご意見等ありましたらお願いいたします。

萩野: 幾つかの点についてコメントと質問を兼ねてお尋ねします。まず、語彙についてです。他の言語にもあると思いますが、いわゆる英語でいうチャンク(chunk)のような、単語レベルではなく、成句的な表現や、決まり文句や連語のような、例を挙げますと、hold a party、take a medicine、take a bathのような表現がありますが、TUFS言語モジュールではこれらは語彙モジュールで扱われるのか、会話モジュールで扱われるのか、どちらなのでしょうか。

川口: それは大変興味深いご質問です。コーパス言語学の分野でもチャンク(chunk)の研究というのは注目されていることは知っていますが、その問題をTUFS言語モジュールの中で、どのように扱うかはまだ決めていません。ただ、おそらく語彙モジュールの中では単語が主になるため、会話モジュールの中のリンク等で一部の成句を説明するか、あるいは熟語を語彙モジュールに取り込むかという選択肢があると思います。また、本日の報告では触れませんでしたが、COE計画の発展的な可能性の一つとして別の計画があります。それは教養教育科目の教材の構築です。たとえば言語学、教育学、経済学のような内容が含まれるサイトをインターネット上でロボットを使って自動的に収集します。次にそのサイトに現れる各分野の用語を頻度順に並べ替えて、最終的には各分野の基本的用語を網羅した教材を作り上げるという計画です。おそらく、この計画ではチャンクの問題が重要な意味をもつように思います。ある単語が非常に頻度が高いのは、単語として高いのか、あるいはチャンクとして高いのか。もしそれがチャンクとして高ければ、その分野の用語を学ぶ際にはチャンクとして学習する必要があります。ただ今申しました計画は、TUFS言語モジュールが一段落してから取りかかるつもりですし、まだまだ構想の段階に留まっています。ただ、いずれにせよご指摘のチャンクの重要性はよく理解できます。

萩野: 第二の点ですが、私はいろいろな国で語学の集中コースを受講したことがあります。それらはすべて成人のためのコースでした。そうして様々な言語をかじって気がついたのですが、TUFS言語モジュールのように機能シラバスに基づく以外に、英語の助動詞のような、いわゆる法動詞を共通の骨組みとして、それを学習方略に関連づけながら学ぶこともできるのではないかと思うのですが、いかがでしょうか。語順や文法構造などはそれぞれ違っていても、canのような法動詞はどの言語にもあるように思います。

川口: 実際にはその点も考慮しています。市販されている日本語の教材は、法動詞と書いていないかもしれませんが、文法シラバスにせよ、機能・概念シラバスにせよ、その中にかなり法的な表現が組み込まれているものが多いと思います。ところが、ヨーロッパ系言語の教材のほとんどは、ギリシャ・ラテン文法を基礎としており、品詞論から出発するシラバスが圧倒的に多いのです。そこでこの二つの教材の流れをどのようにうまく組み合わせるかというところで、今まさにおっしゃられた法動詞や時制やアスペクト等が問題になってきます。これらは教材の中での提示が大変難しい事項だと思います。来年度開発する予定の文法モジュールの基礎研究を通じて、ご意見を頂戴しました点について、さらに汎用文法シラバスについて考えてゆきたいと思います。

萩野: 汎用性に関して言えば、ヨーロッパの諸言語の間では、ある程度の共通性があると思いますが、日本語などは確かにかけ離れていると思います。最後のコメントです。それは言語モジュールの出口評価についてです。TUFS言語モジュールの評価はどのようなものでしょうか。会話モジュールということは、読み書きは入っていないということですか。

川口: ええ、そうです。とりあえずreadingやwritingはもう少し後で考えます。ただ初級レベルから読み書きが必要だということは十分に認識していますし、多数の方々からそういうコメントをいただいています。今、萩野先生が言われたcan do statementのようなものは必要だと思います。基礎研究の段階でEuropean common frameworkやACTFLについての報告を受けました。海外の例を参照しつつ、レベルを考えるときに、何ができるようになるかを明確にしておくことは絶対必要だと思います。

黒澤: ありがとうございました。他にありますでしょうか。
黒田: 私は外語大の留学生支援の会の幹事をやっております。また公民館で日本語指導者の養成もしております。そういった立場上、アカデミックなことはよくわかりませんけれども、実際、いろいろな言語と関わっている者として、本日のシンポジウムを考えますと、これは一つの感想ですが、外国語能力の評価というテーマは、それ自体が一つのゴールであり、またそこに至るまでのストーリーですらあると思いました。この計画にはロマンを感じますし、70歳まで言葉と関わってきた、巷に生きてきた人間としまして、むしろ研究者の方のほうが実はロマンチストであると感じました。今日のお話の中で、馬場先生が客観的に外国語能力を評価するのは難しいのではないかと言われました。しかし、実際、スピーチコンテストの審査員などをして感じますのは、どうしても一位を決めざるを得ません。主観は主観ですが、客観的に評価を出さざるを得ない。しかし審査員が四人五人で全員主観を言うわけです。そのときいつも感じますけれども、客観であっても主観の一部分であり、主観は客観の一部分であるというような気がします。
もう一つ最後に、学問的には非常に正確なことを求められると思いますが、実際に日本語のできない人達に教えておりますと、感じますことが一つあります。それは、日本人自身が日本語を満足に話していない状態、しかもそれを許しあっている許容度の問題です。日頃、私たちが助詞を省略して話しているということに気づいていない。ところがいざ教えるとなると、厳しく「を」を入れなさい、ここは「に」です、とか教えます。自分で助詞を落としているのを気づかないで、一生懸命に助詞を教えている。こういう状態が現場であります。

黒澤: どうもありがとうございました。いろいろと貴重なご指摘があったのではないかと思います。少し話が飛躍しますが、たとえば、言語学の分野では、いろいろな現象を説明するのに抽象的な概念を使って、それをかなり精密に演算して説明するというようなことが行われています。しかし、プラクティカルな観点から、つぼを押さえたような簡単な説明でピタッといくときもあるし、いかないのもあります。主観的に、また印象として理解できる部分とそれを解明することを総合的に組み合わせていけば、学問的にも実践的にも進歩があるのだと思います。

男性: 本日の報告ですが、入口と出口、そこに至る経路が報告者の間で必ずしも一致していないような印象を受けました。たとえば入口ですが、日本語から英語に行くときと、日本語からスペイン語に行くときでは全然違うと思います。途中の経路については、馬場先生がおっしゃられたように、文法から入ってネイティヴとは違う言語になっていいのか、それともできるだけネイティヴに近づけるのか、それによっても対応の仕方が違ってくると思います。小学校英語も日本における英語教育をどうするかということが明確にされないまま、単に総合学習で安易に英語を取り上げる。そういう状況下で英語をどういうふうに教えるかということを考えても、結論は出ないと思います。

黒澤: 言語間の類型的な違いや多様性というのはもちろんありますし、どういう人を対象に教育するのか、学習者の動機は何なのかなど外国語教育を取り巻く環境は多様です。それらは単純な一つのパターンや方式には還元できないと思います。ただ、外国語教育ではプラクティカルな側面というものは厳然とあって、それを進めなければならない必要性はアプリオーリにあると思います。小学校の英語教育にしても、日本の外国語教育にしても、方法論と目的が完全に明確になる前に、どうしても見切り発車しながら行わざるを得ないというのが我々のおかれている現実なのだと思います。

田口: 私は先ほど発言された方とはまったく逆で、報告者の方々は皆さんまとまりを持ちながら話されていたと思いますし、かなり刺激を受けました。

川口: TUFS言語モジュールですが、これだけで完結するような何かとは考えておりません。たとえば言語モジュールがそのまま外語大の教材になるのかさえ現時点では明確ではありません。たぶん大部分の方は、これを副教材として利用されるのではないでしょうか。評価について他に類似する教材のない言語では、これが利用されるかもしれません。それはそれで望ましいことだと思います。第二外国語として学ぶときも有効な手段ではないでしょうか。たとえば鹿児島にいてもトルコ語を学べるようになりますし、北海道にいてもカンボジア語を学ぶことができるようになります。

黒澤: 外国語教育における評価法、とりわけe-learning環境に関わる問題点がいくつか指摘されました。また、英語以外の言語を外国語として教えている大学の実情なども報告されました。話題の尽きないテーマでありますが、予定の時間になりました。報告者の皆さん、出席者の皆さん、本日はありがとうございました。

(原稿作成 倉嶋 典子、校正 黒澤 直俊、川口 裕司)