コーパス言語学概説 前期 水 2 †
- 本授業が該当する授業科目名:
- 博士後期:言語基礎論 前後期 各2 単位
- 博士前期:言語文化研究基礎論 前後期 各2 単位
- 担当教員
- 投野 由紀夫(ランカスター大学 PhD 専門:コーパス言語学、第2言語語彙習得、辞書学)内線5431
後期 †
- 授業の目標
- コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。
- 授業の概要
- コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。
第1回 コース全体のガイダンスと基礎講義,テキストの紹介と分担
前期の残り:CBLS C1(モクジュンスさん), C2(光井さん)
第2回 言語統計の基礎
前期の残り:CBLS C3 & C5
第3回 仮説検定
第4回 相関分析
第5回 回帰分析
第6回 判別分析
第7回 クラスター分析
第8回 主成分分析
第9回 因子分析
第10回 コレスポンデンス分析
第11回 個人研究と発表(1)
第12回 個人研究と発表(2)
第13回 個人研究と発表(3)
第14回 個人研究と発表(4)
第15回 個人研究と発表(5)
後期スケジュール †
- 11/9
- スロベニアの e-lexicography の学会発表のため休講
- 1/25
- Guest speaker: Huaqing Hong (NIE, Singapore)
- 成績の評価
- 出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%)
- 受講上の注意
- 前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。
- テキスト・教材
- 石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版)
前期 †
- 授業の目標
- コーパス言語学の基礎的な知識と検索の基本を身につける。特にコーパス研究の手法を言語学の諸分野へ適用する方法について学ぶ。
- 授業の概要
- テキストの主要部分のまとめの発表およびツール講習を中心に行う。
第1回 コーパス言語学の全体像,テキストの紹介と分担,ツール講習の準備
第2回 コーパス言語学の基礎;実習(1):コンコーダンサーの基礎(AntConc)
第3回 代表性,バランス,標本抽出;実習(2):さまざまなクエリー方法(正規表現 etc.)
第4回 マークアップとアノテーション;実習(3):品詞・構文情報を活かした検索方法
第5回 パラレル&多言語コーパス;実習(4):パラレルコーパスの実際 (ParaConc)
第6回 コーパスの種類(1);実習(5): 主要な web コーパス(1) (COCA, BNCWeb, PIE, etc.)
第7回 コーパスの種類(2); 実習(6):主要な webコーパス(2)(Sketch Engine)
第8回 コーパスの自作(1); 実習(7): Web BootCat によるコーパス自作(1)
第9回 コーパスの自作(2); 実習(8): Web BootCat によるコーパス自作(2)
第10回 コーパスと応用言語学の諸分野(1); 実習(9):分析ツール類の紹介(MLTP, Seagull-Stat, R)
第11回 コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi)
第12回 具体的な研究事例:(a) 辞書学, (b) 文法研究
第13回 具体的な研究事例:(c) 第2言語習得 (d) 語用論
第14回 具体的な研究事例:(e) 会話分析 (f) ジャンル分析,文体論
第15回 まとめと展望
前期スケジュール †
- Chapter2 代表性,バランス,標本抽出 (光井) (スライドPDF)
- 実習(2):さまざまなクエリー方法(正規表現 etc.)
- パラレル&多言語コーパス (恩田) (スライドPDF)
- 実習(4):パラレルコーパスの実際 (ParaConc?)
- Chapter A7 利用できるコーパスの種類 (小山内) (スライドPDF) ※統計のセクションは飛ばします
- Sketch Engine の紹介(BootCat? 除く)
- DIY Corpora (モクジュンス) (スライドPDF)
- コーパスの自作の方法(エディタ類の紹介+BootCat?)
- 6/29
- 長い章ですがざっと見ておきます
- Corpora and Applied Linguistics (レポーター残り4名;一人10分程度 )
- 10.2 - 10.5 (パラメシワラン)
- 10.6 - 10.7 (安)
- 10.8 - 10.9 (恩田) (スライドPDF)
- 10.10 - 10.12 (峰)
- 10.12 - 10.15 (小山内)
- 7/13
- 補講の調整
- 前期のまとめ:コーパスと言語研究(自分の研究の興味・関心と結び付ける)
- 9月30日(予定) 206教室で2時限〜4時限の予定
- 補講期間に補講を行う
- セクションC-1(辞書学) (モクジュンス)
- セクションC-2(文法・語法) (光井)
セクションC-3(言語習得)
セクションC-5(言語使用域)
- 10月12日
- セクションC-6(英-中 パラレルコーパス)(恩田)
ワークシート †
その他備考など †
- 成績の評価
- 出席・参加30%,テキストのまとめの発表30%,課題の提出40%
- 受講上の注意
- コンピューター室での実習が半分,講義が半分となる。
- パソコンに開発・分析環境を整えたいので,ラップトップの持参が望ましい。
- テキストは英語なので最低限,英語文献を読む英語力が必要。
- テキスト・教材
- McEnery?, T., R. Xiao and Y. Tono (2006) Corpus-Based Language Studies: An Advanced Resource Book (Routledge Applied Linguistics)
- 最初の2章分のPDFを以下に貼り付けておくので、注文を早急にして入手お願いします:
- メーリングリスト
- 2011-tono-wed2@tufs.ac.jp (大文字@を小文字に変えてご利用ください)