-[[FrontPage]] -[[コーパス言語学概論・演習2009]] -[[コーパス言語学概論・演習2010]] *コーパス言語学概説 前期 水 2 [#n3fb174d] -本授業が該当する授業科目名: --博士後期:言語基礎論 前後期 各2 単位 --博士前期:言語文化研究基礎論 前後期 各2 単位 -担当教員 --投野 由紀夫(ランカスター大学 PhD 専門:コーパス言語学、第2言語語彙習得、辞書学)内線5431 -教室:206 *後期 [#m3172aff] -授業の目標 --コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。 -授業の概要 --コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。 -授業の計画 第1回 コース全体のガイダンスと基礎講義,テキストの紹介と分担 前期の残り:CBLS C1(モクジュンスさん), C2(光井さん) 第2回 言語統計の基礎 前期の残り:CBLS C3 & C5 第3回 仮説検定 第4回 相関分析 第5回 回帰分析 第6回 判別分析 第7回 クラスター分析 第8回 主成分分析 第9回 因子分析 第10回 コレスポンデンス分析 第11回 個人研究と発表(1) 第12回 個人研究と発表(2) 第13回 個人研究と発表(3) 第14回 個人研究と発表(4) 第15回 個人研究と発表(5) **後期スケジュール [#v15214f3] -10/19 --2章 言語統計の基礎 ---光井 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch2_1.pdf]]) ---モク -10/26, 11/2 --3章 仮説検定 ---ニシャ ---恩田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch3_2.pdf]]) -11/9 --スロベニアの e-lexicography の学会発表のため休講 -11/16 --4章 相関分析 ---鳥越 -11/30 --5章 回帰分析 ---金田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch5.pdf]]) -12/7 --6章 判別分析 ---恩田 -12/14 --7章 クラスター分析 ---光井 -12/21 --8章 主成分分析 ---ニシャ -1/11 --9章 因子分析 ---モク -1/18 --Guest speaker: Huaqing Hong (NIE, Singapore) -1/25 --10章 コレスポンデンス分析 ---金田 -1/25 --Guest speaker: Huaqing Hong (NIE, Singapore) -2/1 -2/8 --金曜日振替のため授業なし #br ---- #br -成績の評価 --出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%) -受講上の注意 --前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。 -テキスト・教材 --石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版) ---- *前期 [#r4d11739] -授業の目標 --コーパス言語学の基礎的な知識と検索の基本を身につける。特にコーパス研究の手法を言語学の諸分野へ適用する方法について学ぶ。 -授業の概要 --テキストの主要部分のまとめの発表およびツール講習を中心に行う。 -授業の計画 第1回 コーパス言語学の全体像,テキストの紹介と分担,ツール講習の準備 第2回 コーパス言語学の基礎;実習(1):コンコーダンサーの基礎(AntConc) 第3回 代表性,バランス,標本抽出;実習(2):さまざまなクエリー方法(正規表現 etc.) 第4回 マークアップとアノテーション;実習(3):品詞・構文情報を活かした検索方法 第5回 パラレル&多言語コーパス;実習(4):パラレルコーパスの実際 (ParaConc) 第6回 コーパスの種類(1);実習(5): 主要な web コーパス(1) (COCA, BNCWeb, PIE, etc.) 第7回 コーパスの種類(2); 実習(6):主要な webコーパス(2)(Sketch Engine) 第8回 コーパスの自作(1); 実習(7): Web BootCat によるコーパス自作(1) 第9回 コーパスの自作(2); 実習(8): Web BootCat によるコーパス自作(2) 第10回 コーパスと応用言語学の諸分野(1); 実習(9):分析ツール類の紹介(MLTP, Seagull-Stat, R) 第11回 コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi) 第12回 具体的な研究事例:(a) 辞書学, (b) 文法研究 第13回 具体的な研究事例:(c) 第2言語習得 (d) 語用論 第14回 具体的な研究事例:(e) 会話分析 (f) ジャンル分析,文体論 第15回 まとめと展望 **前期スケジュール [#v15214f3] -4/13 --ガイダンス -4/20 --Chapter1 コーパス言語学の基礎 (杉山) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_1.pdf]] --実習(1):コンコーダンサーの基礎([[AntConc:http://www.antlab.sci.waseda.ac.jp/software.html]]) (金田) ---[[AntConc日本語マニュアル:http://www.antlab.sci.waseda.ac.jp/software/antconc3.2.2_tutorial_japanese.pdf]] ---[[シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成) -4/27 --Chapter2 代表性,バランス,標本抽出 (光井) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_2.pdf]] --実習(2):さまざまなクエリー方法(正規表現 etc.) ---[[【タグ付き】シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes_tagged.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成) ---[[染谷先生作成レンマリスト(ハイフンなし 外部リンク):http://www.antlab.sci.waseda.ac.jp/software/e_lemma_no_hypen.zip]] -5/11 --第4回 マークアップ(峰) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_3.pdf]] とアノテーション (パラメシワラン) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_4.pdf]] --実習(3):品詞・構文情報を活かした検索方法 ---[[TreeTagger Tagset (PDF):http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/Penn-Treebank-Tagset.pdf]] ---cf. [[Penn Treebank Tag Set:http://www.ims.uni-stuttgart.de/projekte/CorpusWorkbench/CQP-HTMLDemo/PennTreebankTS.html]] ---[[TreeTagger Online:http://web4u.setsunan.ac.jp/Website/TreeOnline.htm]] -5/18 --パラレル&多言語コーパス (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_5.pdf]] --実習(4):パラレルコーパスの実際 (ParaConc) ---[[読売データ>http://mastarpj.nict.go.jp/~mutiyama/jea/index-ja.html]] -5/25 --Chapter A7 利用できるコーパスの種類 (小山内) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_7.pdf]] ※統計のセクションは飛ばします -6/8 --COCA, BNCWeb, PIE などの紹介 -6/15 --Sketch Engine の紹介(BootCat 除く) -6/22 --DIY Corpora (モクジュンス) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_8.pdf]] --コーパスの自作の方法(エディタ類の紹介+BootCat) -6/29 --長い章ですがざっと見ておきます --Corpora and Applied Linguistics (レポーター残り4名;一人10分程度 ) ---10.2 - 10.5 (パラメシワラン) ---10.6 - 10.7 (安) ---10.8 - 10.9 (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_10_8-9.pdf]] ---10.10 - 10.12 (峰) ---10.12 - 10.15 (小山内) -7/13 --補講の調整 --前期のまとめ:コーパスと言語研究(自分の研究の興味・関心と結び付ける) -9月30日(予定) 206教室で2時限〜4時限の予定 --補講期間に補講を行う --セクションC-1(辞書学) (モクジュンス) --セクションC-2(文法・語法) (光井) --%%セクションC-3(言語習得)%% --%%セクションC-5(言語使用域)%% -10月12日 --セクションC-6(英-中 パラレルコーパス)(恩田) **ワークシート [#s3406f26] -[[A2>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A2_worksheet.pdf]] -[[A3>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A3_worksheet.pdf]] -[[A4>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A4_worksheet.pdf]] -[[A5>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A5_worksheet.pdf]] -[[A6>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A6_worksheet.pdf]] -[[A7>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A7_worksheet.pdf]] -[[A8>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A8_worksheet.pdf]] -[[A9>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A9_worksheet.pdf]] -[[A10>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A10_worksheet.pdf]] **その他備考など [#pc8a45a9] -成績の評価 --出席・参加30%,テキストのまとめの発表30%,課題の提出40% -受講上の注意 --コンピューター室での実習が半分,講義が半分となる。 --パソコンに開発・分析環境を整えたいので,ラップトップの持参が望ましい。 --テキストは英語なので最低限,英語文献を読む英語力が必要。 -テキスト・教材 --McEnery, T., R. Xiao and Y. Tono (2006) Corpus-Based Language Studies: An Advanced Resource Book (Routledge Applied Linguistics) ---各自でアマゾンなどで購入すること --最初の2章分のPDFを以下に貼り付けておくので、注文を早急にして入手お願いします: ---Chap 1 [[HERE:>http://corpuscobo.net/class2011/CBLS-A1.pdf]] ---Chap 2 [[HERE:>http://corpuscobo.net/class2011/CBLS-A2.pdf]] -メーリングリスト --2011-tono-wed2@tufs.ac.jp (大文字@を小文字に変えてご利用ください) ----