-[[FrontPage]]
-[[コーパス言語学概論・演習2009]]
-[[コーパス言語学概論・演習2010]]

*コーパス言語学概説	前期  水 2 [#n3fb174d]

-本授業が該当する授業科目名:
--博士後期:言語基礎論	前後期 各2 単位
--博士前期:言語文化研究基礎論	前後期 各2 単位

-担当教員
--投野 由紀夫(ランカスター大学 PhD 専門:コーパス言語学、第2言語語彙習得、辞書学)内線5431

-教室:206

*前期 [#r4d11739]

-授業の目標
--コーパス言語学の基礎的な知識と検索の基本を身につける。特にコーパス研究の手法を言語学の諸分野へ適用する方法について学ぶ。


-授業の概要
--テキストの主要部分のまとめの発表およびツール講習を中心に行う。

-授業の計画

  第1回	コーパス言語学の全体像,テキストの紹介と分担,ツール講習の準備
  第2回	コーパス言語学の基礎;実習(1):コンコーダンサーの基礎(AntConc)
  第3回	代表性,バランス,標本抽出;実習(2):さまざまなクエリー方法(正規表現 etc.) 
  第4回	マークアップとアノテーション;実習(3):品詞・構文情報を活かした検索方法
  第5回	パラレル&多言語コーパス;実習(4):パラレルコーパスの実際 (ParaConc)
  第6回	コーパスの種類(1);実習(5): 主要な web コーパス(1) (COCA, BNCWeb, PIE, etc.)
  第7回	コーパスの種類(2); 実習(6):主要な webコーパス(2)(Sketch Engine)
  第8回	コーパスの自作(1); 実習(7): Web BootCat によるコーパス自作(1)
  第9回	コーパスの自作(2); 実習(8): Web BootCat によるコーパス自作(2)
  第10回	コーパスと応用言語学の諸分野(1); 実習(9):分析ツール類の紹介(MLTP, Seagull-Stat, R)
  第11回	コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi, Sketch Engine)
  第12回	具体的な研究事例:(a) 辞書学, (b) 文法研究
  第13回	具体的な研究事例:(c) 第2言語習得 (d) 語用論 
  第14回	具体的な研究事例:(e) 会話分析 (f) ジャンル分析,文体論
  第15回	まとめと展望


**前期スケジュール [#v15214f3]

-4/13

--ガイダンス

-4/20

--Chapter1 コーパス言語学の基礎 (杉山) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_1.pdf]]
--実習(1):コンコーダンサーの基礎([[AntConc:http://www.antlab.sci.waseda.ac.jp/software.html]]) (金田)
---[[AntConc日本語マニュアル:http://www.antlab.sci.waseda.ac.jp/software/antconc3.2.2_tutorial_japanese.pdf]]
---[[シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)

-4/27

--Chapter2 代表性,バランス,標本抽出 (光井) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_2.pdf]]
--実習(2):さまざまなクエリー方法(正規表現 etc.)
---[[【タグ付き】シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes_tagged.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)
---[[染谷先生作成レンマリスト(ハイフンなし 外部リンク):http://www.antlab.sci.waseda.ac.jp/software/e_lemma_no_hypen.zip]]

-5/11

--第4回	マークアップ(峰)とアノテーション (パラメシワラン)
--第4回	マークアップ(峰)とアノテーション (パラメシワラン) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_4.pdf]]
--実習(3):品詞・構文情報を活かした検索方法
---[[TreeTagger Tagset (PDF):http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/Penn-Treebank-Tagset.pdf]]
---cf. [[Penn Treebank Tag Set:http://www.ims.uni-stuttgart.de/projekte/CorpusWorkbench/CQP-HTMLDemo/PennTreebankTS.html]]
---[[TreeTagger Online:http://web4u.setsunan.ac.jp/Website/TreeOnline.htm]]

-5/18

--パラレル&多言語コーパス (恩田)
--パラレル&多言語コーパス (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_5.pdf]]
--実習(4):パラレルコーパスの実際 (ParaConc)
---[[読売データ>http://mastarpj.nict.go.jp/~mutiyama/jea/index-ja.html]]

-5/25

--利用できるコーパスの種類(Chapter A7)※統計のセクションは飛ばします
--2名で担当して下さい
--Chapter A7 利用できるコーパスの種類(長内)※統計のセクションは飛ばします


-6/8

--COCA, BNCWeb, PIE などの紹介

-6/15

--Sketch Engine の紹介(BootCat 除く)

-6/22

--DIY Corpora (レポーター1名:)
--コーパスの自作の方法(エディタ類の紹介)

-6/29

--DIY Corpora の続き
--Web BootCat を使ったコーパス自作の実際


**ワークシート [#s3406f26]

-[[A2>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A2_worksheet.pdf]]
-[[A3>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A3_worksheet.pdf]]
-[[A4>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A4_worksheet.pdf]]
-[[A5>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A5_worksheet.pdf]]
-[[A6>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A6_worksheet.pdf]]
-[[A7>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A7_worksheet.pdf]]
-[[A8>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A8_worksheet.pdf]]
-[[A9>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A9_worksheet.pdf]]
-[[A10>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A10_worksheet.pdf]]



**その他備考など [#pc8a45a9]

-成績の評価
--出席・参加30%,テキストのまとめの発表30%,課題の提出40%

-受講上の注意
--コンピューター室での実習が半分,講義が半分となる。 
--パソコンに開発・分析環境を整えたいので,ラップトップの持参が望ましい。 
--テキストは英語なので最低限,英語文献を読む英語力が必要。

-テキスト・教材
--McEnery, T., R. Xiao and Y. Tono (2006) Corpus-Based Language Studies: An Advanced Resource Book (Routledge Applied Linguistics)
---各自でアマゾンなどで購入すること
--最初の2章分のPDFを以下に貼り付けておくので、注文を早急にして入手お願いします:
---Chap 1 [[HERE:>http://corpuscobo.net/class2011/CBLS-A1.pdf]]
---Chap 2 [[HERE:>http://corpuscobo.net/class2011/CBLS-A2.pdf]]

-メーリングリスト
--2011-tono-wed2@tufs.ac.jp (大文字@を小文字に変えてご利用ください)

----

*後期 [#m3172aff]

-授業の目標
--コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。
-授業の概要
--コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。

-授業の計画

  第1回	コース全体のガイダンスと基礎講義,テキストの紹介と分担
  第2回	言語統計の基礎
  第3回	仮説検定
  第4回	相関分析
  第5回	回帰分析
  第6回	判別分析
  第7回	クラスター分析
  第8回	主成分分析
  第9回	因子分析
  第10回	コレスポンデンス分析
  第11回	個人研究と発表(1)
  第12回	個人研究と発表(2)
  第13回	個人研究と発表(3)
  第14回	個人研究と発表(4)
  第15回	個人研究と発表(5)

-成績の評価
--出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%)

-受講上の注意
--前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。

-テキスト・教材
--石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版)


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS