FrontPage

言語教育学演習2015(水2 前・後期)

教室

  • 420教室

講義題目(和文)

  • コーパスを用いた学習者英語分析と教材作成への応用 (J)

授業の目標

  • コーパス言語学の基礎的概念の習得とその応用分野としての CEFR 準拠の学習者データのコーパス分析の概要を知る。

授業の概要

  • コーパス言語学の基礎概念をテキストを購読しながら学ぶと同時に,コーパス処理の基礎を習得する。 

授業計画(秋)

  • テキストを用いた専門知識と実際の研究例の理解
  • Sketch Engine を用いた学習者データの検索技法の習得
    • ゼミ生で Sketch Engine のマニュアルを作成
  • CEFR の理解に関してはハンドブック以外に CEFR 関連の資料を読む
  • ハンドブックを10-11月で読破
  • CEFR関連の資料を読んで作業開始(12月〜)
  • 中間報告(1月始め)
    • 道原:逆接の接続詞
      • But, however: パラグラフ単位?
      • どうやってパラグラフ単位の逆接を分析するのか?
      • 逆接:but は文頭では使わない → academic writing
    • 山崎:NICT JLE の n-gram による接続詞の使用について
      • NS vs NNS: n-gram 比較
      • and, but を含む n-gram がNNSに少ない
  • 発表会(1月下旬 or 2月初旬)

授業の計画(春)

  • テキストを用いた専門知識の理解と Sketch Engine というコーパス検索システムの使用法に習熟する。
  • 第1回 イントロダクション:コーパスと言語教材作成
  • 第2回 コーパス言語学の基礎(1):コーパスの定義と歴史的変遷 (CBLS Unit A1)
  • 第3回 コーパス言語学の基礎(2):代表性・バランス・標本 (CBLS Unit A2 + B1.2 & B1.3  + Brown Corpus での AntConc? の実習)
  • 第4回 コーパス言語学の基礎(3):Markup & annotation (CBLS Unit A3 & A4)
  • 第5回 コーパス言語学の基礎(4):コーパスと応用分野 (CBLS Unit A10)
  • 10.2-10.3:川本
  • 10.4-10.5:安宅
  • 10.6-10.7:尾崎
  • 10.8:中島
  • 第6回 A10 の残り+ AntConc? を使った実習
  • 10.9-10.10:廣池
  • 10.11-10.12:山崎
  • 10.13-10.15:ローレンス
  • 第7回 AntConc? を使った実習の続き
  • 正規表現を用いたより複雑な検索
  • Cluster/ n-gram/ keyword analysis
  • Tagging データの処理
  • 第8回(6/3) コーパス言語学の基礎(5):コーパスと辞書 (CBLS Unit C1) 担当:廣池さん
  • 第9回(6/10) コーパス言語学の基礎(6):コーパスと文法研究 (CBLS Unit C2)  担当:山崎さん
    • 発表資料(山崎)
    • Antconc:cluster/keyword analysis
    • 6/17 教育実習視察が入り休講になります
    • 6/24 アジア辞書学会(香港)に出張のため休講になります
  • 第10回(7/1) コーパス言語学の基礎(7):コーパスと言語習得研究 (CBLS Unit C3) 担当:尾崎さん
  • 第11回(7/8) コーパス言語学の基礎(8):コーパスと翻訳研究 (CBLS Unit C6) 担当:ローレンスくん
以下の内容は夏休み中のゼミ合宿で扱います
第12回 CEFR準拠の学習者データの分析(1):English Profile の学習者データ分析 の概要
第13回 CEFR準拠の学習者データの分析(2):エラータグ付与の実際
第14回 CEFR準拠の学習者データの分析(3):基準特性抽出の研究概観
第15回 CEFR準拠の学習者データの分析(4):学習者コーパスの種類と基礎的な処理 演習

テキスト

ISBN0415286239
書名Corpus-based language studies : an advanced resource book
著者名McEnery?, T., Xiao, R., & Tono, Y.
出版社Routledge
出版年2006

PDF

テキストがくるまで以下をダウンロードして利用して下さい:

READING:

Discussion questions

  • Chapter 1:
  • What is a corpus? Discuss some common features by comparing different definitions.
  • Why use computers to study language? What is your intuitive answer to this? What other reasons did you find in the text?
  • Discuss the use of corpora and the use of intuition. Are they mutually exclusive?
  • Is corpus linguistics a methodology or a theory?
  • How different are corpus-based vs. corpus-driven approaches? Can you think of any concrete examples?
  • Chapter 2:
  • 2.2
  • What is "representativeness"?
  • What does it mean when Biber says "Representativeness refers to the extent to which a sample includes the full range of variabilityin a population." (p.13)
  • What are "internal" and "external" criteria used to select texts for a corpus? (p.14)
  • The authors say that it is problematical to use internal criteria as the primary parameters for the selection of corpus data. Why? (p.14)
  • Explain what Biber calls a 'cyclical fashion'? (p.14)
  • Static sample corpora, if resampled, may also allow the study of language change over time. (p.15) How?
  • 2.3
  • What are "general" vs. "specialized" corpora? How is representativeness achieved in these corpora?
  • 2.4
  • How is the acceptable balance of a corpus determined?
  • Any claim of corpus balance is largely an act of faith. (p.16) What does this mean?
  • Explain the design of the British National Corpus, using the terms 'domain', 'time', 'medium', 'demographic' and 'context-governed'. How is it balanced?
  • Elaborate on the following statements:
    • Representativeness links to research questions. (p.18)
    • Representativeness is a fluid concept. (p.18)
  • 2.5
  • Explain the notion of sampling using the following terms:
    • sample/ population/ sampling unit/ sampling frame
  • What is the difference between 'simple random sampling' and 'stratified random sampling'?
  • Describe pros and cons of 'full text samples'
  • Chapter 3
  • 3.2
    • What are the three reasons for corpus mark-up? Discuss each case with complete examples.
  • 3.3
    • Here, you should at least familiarize yourself with the following schemes:
      • COCOA (dated)
      • TEI (current standard) << website >>
           --> header vs. body
        Q1. What does the TEI header specify?
        Q2. What kind of information is in the TEI body?
  • Corpus Encoding Standard (CES) & XCES << website >>
  • Chapter 4
  • What is corpus annotation and how is it different from corpus mark-up?
  • 4.2
    • What are the four advantages for corpus annotation?
    • What are some of the criticisms against corpus annotation? What is the authors' response?
  • 4.3
  • Look at concrete examples for each type of annotation:
  • Problem-oriented annotation
  • Chapter 5-9
  • Make a summary on your own
  • Chapter 10
  • Summarize the use of corpus data in the following areas briefly
  • The major areas of linguistics
    • lexicographic and lexical studies (10.2)
    • grammatical studies (10.3)
    • register variation and genre analysis (10.4)
    • dialect distinction and language variety (10.5)
    • contrastive and translation studies (10.6)
    • diachronic study and language change (10.7)
    • language learning and teaching (10.8)
  • Other areas which have started to use corpus data
    • Semantics (10.9)
    • Pragmatics (10.10)
    • Sociolinguistics (10.11)
    • Discourse analysis (10.12)
    • Stylistics and literary studies (10.13)
    • Forensic linguistics (10.14)
  • What is the limitation of corpus data? (10.15)

Sketch Engine CQL memo

  • help + bare infinitives
    • Brown Family の CLAWS7 tagset の検索式:
      • [lemma="help"] [tag="VVI|VV0"]
  • help + to + V
    • [lemma="help"] [lemma="to"] [tag="VVI"]
  • make + a + adj(optional) + NOUN
    • [lemma="make"] [word="a"] [tag="JJ"]? [tag="NN1"]

カイ2乗検定など

  • js-STAR
    • web で計算できる統計

Sample data for error tagging

TUTORIALS: Corpus query tools

  • 学内では IP auth をクリックすれば,どこからでもアクセスできます
  • Antconc (for Windows & Mac) 汎用コンコーダンサー
  • Casualconc (for Mac) 汎用コンコーダンサー
  • Tagant TreeTagger を簡単に使えるようにした品詞タグ付与ソフト

Concordance 資料


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2016-01-20 (水) 11:00:34 (3164d)