- 追加された行はこの色です。
- 削除された行はこの色です。
-[[FrontPage]]
-[[コーパス言語学概論・演習2009]]
-[[コーパス言語学概論・演習2010]]
*コーパス言語学概説 前期 水 2 [#n3fb174d]
-本授業が該当する授業科目名:
--博士後期:言語基礎論 前後期 各2 単位
--博士前期:言語文化研究基礎論 前後期 各2 単位
-担当教員
--投野 由紀夫(ランカスター大学 PhD 専門:コーパス言語学、第2言語語彙習得、辞書学)内線5431
-教室:206
*後期 [#m3172aff]
-授業の目標
--コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。
-授業の概要
--コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。
-授業の計画
第1回 コース全体のガイダンスと基礎講義,テキストの紹介と分担
前期の残り:CBLS C1(モクジュンスさん), C2(光井さん)
第2回 言語統計の基礎
前期の残り:CBLS C3 & C5
第3回 仮説検定
第4回 相関分析
第5回 回帰分析
第6回 判別分析
第7回 クラスター分析
第8回 主成分分析
第9回 因子分析
第10回 コレスポンデンス分析
第11回 個人研究と発表(1)
第12回 個人研究と発表(2)
第13回 個人研究と発表(3)
第14回 個人研究と発表(4)
第15回 個人研究と発表(5)
**後期スケジュール [#v15214f3]
-10/19
--2章 言語統計の基礎
---光井 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch2_1.pdf]])
---モク
-10/26, 11/2
--3章 仮説検定
---ニシャ
---恩田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch3_2.pdf]])
-11/9
--スロベニアの e-lexicography の学会発表のため休講
-11/16
--4章 相関分析
---鳥越
-11/30
--5章 回帰分析
---金田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch5.pdf]])
-12/7
--6章 判別分析
---恩田
-12/14
--7章 クラスター分析
---光井
-12/21
--8章 主成分分析
---ニシャ
-1/11
--9章 因子分析
---モク
-1/18
--Guest speaker: Huaqing Hong (NIE, Singapore)
-1/25
--9章 因子分析
---モク
-2/1
--10章 コレスポンデンス分析
---金田
-2/1
-2/8
--金曜日振替のため授業なし
#br
----
#br
-成績の評価
--出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%)
-受講上の注意
--前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。
-テキスト・教材
--石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版)
----
*前期 [#r4d11739]
-授業の目標
--コーパス言語学の基礎的な知識と検索の基本を身につける。特にコーパス研究の手法を言語学の諸分野へ適用する方法について学ぶ。
-授業の概要
--テキストの主要部分のまとめの発表およびツール講習を中心に行う。
-授業の計画
第1回 コーパス言語学の全体像,テキストの紹介と分担,ツール講習の準備
第2回 コーパス言語学の基礎;実習(1):コンコーダンサーの基礎(AntConc)
第3回 代表性,バランス,標本抽出;実習(2):さまざまなクエリー方法(正規表現 etc.)
第4回 マークアップとアノテーション;実習(3):品詞・構文情報を活かした検索方法
第5回 パラレル&多言語コーパス;実習(4):パラレルコーパスの実際 (ParaConc)
第6回 コーパスの種類(1);実習(5): 主要な web コーパス(1) (COCA, BNCWeb, PIE, etc.)
第7回 コーパスの種類(2); 実習(6):主要な webコーパス(2)(Sketch Engine)
第8回 コーパスの自作(1); 実習(7): Web BootCat によるコーパス自作(1)
第9回 コーパスの自作(2); 実習(8): Web BootCat によるコーパス自作(2)
第10回 コーパスと応用言語学の諸分野(1); 実習(9):分析ツール類の紹介(MLTP, Seagull-Stat, R)
第11回 コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi)
第12回 具体的な研究事例:(a) 辞書学, (b) 文法研究
第13回 具体的な研究事例:(c) 第2言語習得 (d) 語用論
第14回 具体的な研究事例:(e) 会話分析 (f) ジャンル分析,文体論
第15回 まとめと展望
**前期スケジュール [#v15214f3]
-4/13
--ガイダンス
-4/20
--Chapter1 コーパス言語学の基礎 (杉山) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_1.pdf]]
--実習(1):コンコーダンサーの基礎([[AntConc:http://www.antlab.sci.waseda.ac.jp/software.html]]) (金田)
---[[AntConc日本語マニュアル:http://www.antlab.sci.waseda.ac.jp/software/antconc3.2.2_tutorial_japanese.pdf]]
---[[シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)
-4/27
--Chapter2 代表性,バランス,標本抽出 (光井) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_2.pdf]]
--実習(2):さまざまなクエリー方法(正規表現 etc.)
---[[【タグ付き】シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes_tagged.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)
---[[染谷先生作成レンマリスト(ハイフンなし 外部リンク):http://www.antlab.sci.waseda.ac.jp/software/e_lemma_no_hypen.zip]]
-5/11
--第4回 マークアップ(峰) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_3.pdf]] とアノテーション (パラメシワラン) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_4.pdf]]
--実習(3):品詞・構文情報を活かした検索方法
---[[TreeTagger Tagset (PDF):http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/Penn-Treebank-Tagset.pdf]]
---cf. [[Penn Treebank Tag Set:http://www.ims.uni-stuttgart.de/projekte/CorpusWorkbench/CQP-HTMLDemo/PennTreebankTS.html]]
---[[TreeTagger Online:http://web4u.setsunan.ac.jp/Website/TreeOnline.htm]]
-5/18
--パラレル&多言語コーパス (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_5.pdf]]
--実習(4):パラレルコーパスの実際 (ParaConc)
---[[読売データ>http://mastarpj.nict.go.jp/~mutiyama/jea/index-ja.html]]
-5/25
--Chapter A7 利用できるコーパスの種類 (小山内) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_7.pdf]] ※統計のセクションは飛ばします
-6/8
--COCA, BNCWeb, PIE などの紹介
-6/15
--Sketch Engine の紹介(BootCat 除く)
-6/22
--DIY Corpora (モクジュンス) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_8.pdf]]
--コーパスの自作の方法(エディタ類の紹介+BootCat)
-6/29
--長い章ですがざっと見ておきます
--Corpora and Applied Linguistics (レポーター残り4名;一人10分程度 )
---10.2 - 10.5 (パラメシワラン)
---10.6 - 10.7 (安)
---10.8 - 10.9 (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_10_8-9.pdf]]
---10.10 - 10.12 (峰)
---10.12 - 10.15 (小山内)
-7/13
--補講の調整
--前期のまとめ:コーパスと言語研究(自分の研究の興味・関心と結び付ける)
-9月30日(予定) 206教室で2時限〜4時限の予定
--補講期間に補講を行う
--セクションC-1(辞書学) (モクジュンス)
--セクションC-2(文法・語法) (光井)
--%%セクションC-3(言語習得)%%
--%%セクションC-5(言語使用域)%%
-10月12日
--セクションC-6(英-中 パラレルコーパス)(恩田)
**ワークシート [#s3406f26]
-[[A2>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A2_worksheet.pdf]]
-[[A3>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A3_worksheet.pdf]]
-[[A4>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A4_worksheet.pdf]]
-[[A5>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A5_worksheet.pdf]]
-[[A6>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A6_worksheet.pdf]]
-[[A7>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A7_worksheet.pdf]]
-[[A8>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A8_worksheet.pdf]]
-[[A9>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A9_worksheet.pdf]]
-[[A10>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A10_worksheet.pdf]]
**その他備考など [#pc8a45a9]
-成績の評価
--出席・参加30%,テキストのまとめの発表30%,課題の提出40%
-受講上の注意
--コンピューター室での実習が半分,講義が半分となる。
--パソコンに開発・分析環境を整えたいので,ラップトップの持参が望ましい。
--テキストは英語なので最低限,英語文献を読む英語力が必要。
-テキスト・教材
--McEnery, T., R. Xiao and Y. Tono (2006) Corpus-Based Language Studies: An Advanced Resource Book (Routledge Applied Linguistics)
---各自でアマゾンなどで購入すること
--最初の2章分のPDFを以下に貼り付けておくので、注文を早急にして入手お願いします:
---Chap 1 [[HERE:>http://corpuscobo.net/class2011/CBLS-A1.pdf]]
---Chap 2 [[HERE:>http://corpuscobo.net/class2011/CBLS-A2.pdf]]
-メーリングリスト
--2011-tono-wed2@tufs.ac.jp (大文字@を小文字に変えてご利用ください)
----