-[[FrontPage]]
-[[コーパス言語学概論・演習2009]]
-[[コーパス言語学概論・演習2010]]

*コーパス言語学概説	前期  水 2 [#n3fb174d]

-本授業が該当する授業科目名:
--博士後期:言語基礎論	前後期 各2 単位
--博士前期:言語文化研究基礎論	前後期 各2 単位

-担当教員
--投野 由紀夫(ランカスター大学 PhD 専門:コーパス言語学、第2言語語彙習得、辞書学)内線5431

-教室:206

*後期 [#m3172aff]

-授業の目標
--コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。
-授業の概要
--コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。

-授業の計画

  第1回	コース全体のガイダンスと基礎講義,テキストの紹介と分担
      前期の残り:CBLS C1(モクジュンスさん), C2(光井さん)
  第2回	言語統計の基礎
      前期の残り:CBLS C3 & C5
  第3回	仮説検定
  第4回	相関分析
  第5回	回帰分析
  第6回	判別分析
  第7回	クラスター分析
  第8回	主成分分析
  第9回	因子分析
  第10回	コレスポンデンス分析
  第11回	個人研究と発表(1)
  第12回	個人研究と発表(2)
  第13回	個人研究と発表(3)
  第14回	個人研究と発表(4)
  第15回	個人研究と発表(5)

**後期スケジュール [#v15214f3]

-10/19
--2章 言語統計の基礎
---光井 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch2_1.pdf]])
---モク

-10/26, 11/2
--3章 仮説検定
---ニシャ
---恩田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch3_2.pdf]])

-11/9
--スロベニアの e-lexicography の学会発表のため休講

-11/16
--4章 相関分析
---鳥越

-11/30
--5章 回帰分析
---金田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch5.pdf]])

-12/7
--6章 判別分析
---恩田

-12/14
--7章 クラスター分析
---光井

-12/21
--8章 主成分分析
---ニシャ

-1/11
--9章 因子分析
---モク

-1/18
--10章 コレスポンデンス分析
---金田

-1/25
--Guest speaker: Huaqing Hong (NIE, Singapore)

-2/1

-2/8
--金曜日振替のため授業なし

#br
----
#br

-成績の評価
--出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%)

-受講上の注意
--前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。

-テキスト・教材
--石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版)



----

*前期 [#r4d11739]

-授業の目標
--コーパス言語学の基礎的な知識と検索の基本を身につける。特にコーパス研究の手法を言語学の諸分野へ適用する方法について学ぶ。


-授業の概要
--テキストの主要部分のまとめの発表およびツール講習を中心に行う。

-授業の計画

  第1回	コーパス言語学の全体像,テキストの紹介と分担,ツール講習の準備
  第2回	コーパス言語学の基礎;実習(1):コンコーダンサーの基礎(AntConc)
  第3回	代表性,バランス,標本抽出;実習(2):さまざまなクエリー方法(正規表現 etc.) 
  第4回	マークアップとアノテーション;実習(3):品詞・構文情報を活かした検索方法
  第5回	パラレル&多言語コーパス;実習(4):パラレルコーパスの実際 (ParaConc)
  第6回	コーパスの種類(1);実習(5): 主要な web コーパス(1) (COCA, BNCWeb, PIE, etc.)
  第7回	コーパスの種類(2); 実習(6):主要な webコーパス(2)(Sketch Engine)
  第8回	コーパスの自作(1); 実習(7): Web BootCat によるコーパス自作(1)
  第9回	コーパスの自作(2); 実習(8): Web BootCat によるコーパス自作(2)
  第10回	コーパスと応用言語学の諸分野(1); 実習(9):分析ツール類の紹介(MLTP, Seagull-Stat, R)
  第11回	コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi, Sketch Engine)
  第11回	コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi)
  第12回	具体的な研究事例:(a) 辞書学, (b) 文法研究
  第13回	具体的な研究事例:(c) 第2言語習得 (d) 語用論 
  第14回	具体的な研究事例:(e) 会話分析 (f) ジャンル分析,文体論
  第15回	まとめと展望


**前期スケジュール [#v15214f3]

-4/13

--ガイダンス

-4/20

--Chapter1 コーパス言語学の基礎 (杉山)
--Chapter1 コーパス言語学の基礎 (杉山) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_1.pdf]]
--実習(1):コンコーダンサーの基礎([[AntConc:http://www.antlab.sci.waseda.ac.jp/software.html]]) (金田)
---[[AntConc日本語マニュアル:http://www.antlab.sci.waseda.ac.jp/software/antconc3.2.2_tutorial_japanese.pdf]]
---[[シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)

-4/27

--Chapter2 代表性,バランス,標本抽出 (光井)
--Chapter2 代表性,バランス,標本抽出 (光井) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_2.pdf]]
--実習(2):さまざまなクエリー方法(正規表現 etc.)
---[[【タグ付き】シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes_tagged.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)
---[[染谷先生作成レンマリスト(ハイフンなし 外部リンク):http://www.antlab.sci.waseda.ac.jp/software/e_lemma_no_hypen.zip]]

-5/11

--第4回	マークアップ(峰)とアノテーション (パラメシワラン)
--第4回	マークアップ(峰) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_3.pdf]] とアノテーション (パラメシワラン) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_4.pdf]]
--実習(3):品詞・構文情報を活かした検索方法
---[[TreeTagger Tagset (PDF):http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/Penn-Treebank-Tagset.pdf]]
---cf. [[Penn Treebank Tag Set:http://www.ims.uni-stuttgart.de/projekte/CorpusWorkbench/CQP-HTMLDemo/PennTreebankTS.html]]
---[[TreeTagger Online:http://web4u.setsunan.ac.jp/Website/TreeOnline.htm]]

-5/18

--パラレル&多言語コーパス (恩田)
--パラレル&多言語コーパス (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_5.pdf]]
--実習(4):パラレルコーパスの実際 (ParaConc)
---[[読売データ>http://mastarpj.nict.go.jp/~mutiyama/jea/index-ja.html]]

-5/25

--Chapter A7 利用できるコーパスの種類 (小山内) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_7.pdf]] ※統計のセクションは飛ばします

-6月第1〜4週:学会・講演等で授業調整が必要。相談させてください。

-6/8

--COCA, BNCWeb, PIE などの紹介

-6/15

--Sketch Engine の紹介(BootCat 除く)

-6/22

--DIY Corpora (モクジュンス) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_8.pdf]]
--コーパスの自作の方法(エディタ類の紹介+BootCat)

-6/29
--長い章ですがざっと見ておきます
--Corpora and Applied Linguistics (レポーター残り4名;一人10分程度 )
---10.2 - 10.5 (パラメシワラン)
---10.6 - 10.7 (安)
---10.8 - 10.9 (恩田)  ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_10_8-9.pdf]]
---10.10 - 10.12 (峰)
---10.12 - 10.15 (小山内)

-7/13
--補講の調整
--前期のまとめ:コーパスと言語研究(自分の研究の興味・関心と結び付ける)

-9月30日(予定) 206教室で2時限〜4時限の予定
--補講期間に補講を行う
--セクションC-1(辞書学) (モクジュンス)
--セクションC-2(文法・語法) (光井)
--%%セクションC-3(言語習得)%%
--%%セクションC-5(言語使用域)%%

-10月12日
--セクションC-6(英-中 パラレルコーパス)(恩田)

**ワークシート [#s3406f26]

-[[A2>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A2_worksheet.pdf]]
-[[A3>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A3_worksheet.pdf]]
-[[A4>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A4_worksheet.pdf]]
-[[A5>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A5_worksheet.pdf]]
-[[A6>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A6_worksheet.pdf]]
-[[A7>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A7_worksheet.pdf]]
-[[A8>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A8_worksheet.pdf]]
-[[A9>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A9_worksheet.pdf]]
-[[A10>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A10_worksheet.pdf]]



**その他備考など [#pc8a45a9]

-成績の評価
--出席・参加30%,テキストのまとめの発表30%,課題の提出40%

-受講上の注意
--コンピューター室での実習が半分,講義が半分となる。 
--パソコンに開発・分析環境を整えたいので,ラップトップの持参が望ましい。 
--テキストは英語なので最低限,英語文献を読む英語力が必要。

-テキスト・教材
--McEnery, T., R. Xiao and Y. Tono (2006) Corpus-Based Language Studies: An Advanced Resource Book (Routledge Applied Linguistics)
---各自でアマゾンなどで購入すること
--最初の2章分のPDFを以下に貼り付けておくので、注文を早急にして入手お願いします:
---Chap 1 [[HERE:>http://corpuscobo.net/class2011/CBLS-A1.pdf]]
---Chap 2 [[HERE:>http://corpuscobo.net/class2011/CBLS-A2.pdf]]

-メーリングリスト
--2011-tono-wed2@tufs.ac.jp (大文字@を小文字に変えてご利用ください)

----

*後期 [#m3172aff]

-授業の目標
--コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。
-授業の概要
--コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。

-授業の計画

  第1回	コース全体のガイダンスと基礎講義,テキストの紹介と分担
  第2回	言語統計の基礎
  第3回	仮説検定
  第4回	相関分析
  第5回	回帰分析
  第6回	判別分析
  第7回	クラスター分析
  第8回	主成分分析
  第9回	因子分析
  第10回	コレスポンデンス分析
  第11回	個人研究と発表(1)
  第12回	個人研究と発表(2)
  第13回	個人研究と発表(3)
  第14回	個人研究と発表(4)
  第15回	個人研究と発表(5)

-成績の評価
--出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%)

-受講上の注意
--前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。

-テキスト・教材
--石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版)


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS