-[[FrontPage]]
-[[コーパス言語学概論・演習2009]]
-[[コーパス言語学概論・演習2010]]

*コーパス言語学概説	前期  水 2 [#n3fb174d]

-本授業が該当する授業科目名:
--博士後期:言語基礎論	前後期 各2 単位
--博士前期:言語文化研究基礎論	前後期 各2 単位

-担当教員
--投野 由紀夫(ランカスター大学 PhD 専門:コーパス言語学、第2言語語彙習得、辞書学)内線5431

-教室:206

*後期 [#m3172aff]

-授業の目標
--コーパスを用いた言語研究の具体的事例を,特にその言語処理分析方法に注目して方法論を学び,かつそれを応用したケース・スタディで手法の習得を目指す。
-授業の概要
--コーパスを用いた英語・日本語処理の基礎および統計手法のヴァリエーションを学ぶ。後半はケース・スタディとして自分のテーマを決めて分析を行った結果を発表する。

-授業の計画

  第1回	コース全体のガイダンスと基礎講義,テキストの紹介と分担
      前期の残り:CBLS C1(モクジュンスさん), C2(光井さん)
  第2回	言語統計の基礎
      前期の残り:CBLS C3 & C5
  第3回	仮説検定
  第4回	相関分析
  第5回	回帰分析
  第6回	判別分析
  第7回	クラスター分析
  第8回	主成分分析
  第9回	因子分析
  第10回	コレスポンデンス分析
  第11回	個人研究と発表(1)
  第12回	個人研究と発表(2)
  第13回	個人研究と発表(3)
  第14回	個人研究と発表(4)
  第15回	個人研究と発表(5)

**後期スケジュール [#v15214f3]

-10/19
--2章 言語統計の基礎
---光井 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch2_1.pdf]])
---モク

-10/26, 11/2
--3章 仮説検定
---ニシャ
---恩田
---恩田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch3_2.pdf]])

-11/9
--スロベニアの e-lexicography の学会発表のため休講

-11/16
--4章 相関分析
---鳥越

-11/30
--5章 回帰分析
---金田
---金田 ([[発表スライドPDF:http://lexicon.tufs.ac.jp/~class2009/2011wed2/stats_ch5.pdf]])

-12/7
--6章 判別分析
---恩田

-12/14
--7章 クラスター分析
---光井

-12/21
--8章 主成分分析
---ニシャ

-1/18
--Guest speaker: Huaqing Hong (NIE, Singapore)

-1/25
--9章 因子分析
---金田

-2/1
--10章 コレスポンデンス分析
---鳥越

#br
----
#br

-成績の評価
--出席20%,参加(プレゼン)30%,個人研究発表とレポート提出(50%)

-受講上の注意
--前期の投野担当の「言語文化研究基礎論」を受講していることが望ましい。

-テキスト・教材
--石川慎一郎・前田忠彦・山崎誠(編著)『言語研究のための統計入門』(くろしお出版)



----

*前期 [#r4d11739]

-授業の目標
--コーパス言語学の基礎的な知識と検索の基本を身につける。特にコーパス研究の手法を言語学の諸分野へ適用する方法について学ぶ。


-授業の概要
--テキストの主要部分のまとめの発表およびツール講習を中心に行う。

-授業の計画

  第1回	コーパス言語学の全体像,テキストの紹介と分担,ツール講習の準備
  第2回	コーパス言語学の基礎;実習(1):コンコーダンサーの基礎(AntConc)
  第3回	代表性,バランス,標本抽出;実習(2):さまざまなクエリー方法(正規表現 etc.) 
  第4回	マークアップとアノテーション;実習(3):品詞・構文情報を活かした検索方法
  第5回	パラレル&多言語コーパス;実習(4):パラレルコーパスの実際 (ParaConc)
  第6回	コーパスの種類(1);実習(5): 主要な web コーパス(1) (COCA, BNCWeb, PIE, etc.)
  第7回	コーパスの種類(2); 実習(6):主要な webコーパス(2)(Sketch Engine)
  第8回	コーパスの自作(1); 実習(7): Web BootCat によるコーパス自作(1)
  第9回	コーパスの自作(2); 実習(8): Web BootCat によるコーパス自作(2)
  第10回	コーパスと応用言語学の諸分野(1); 実習(9):分析ツール類の紹介(MLTP, Seagull-Stat, R)
  第11回	コーパスと応用言語学の諸分野(2); 実習(10):分析ツール類の紹介(ChaKi)
  第12回	具体的な研究事例:(a) 辞書学, (b) 文法研究
  第13回	具体的な研究事例:(c) 第2言語習得 (d) 語用論 
  第14回	具体的な研究事例:(e) 会話分析 (f) ジャンル分析,文体論
  第15回	まとめと展望


**前期スケジュール [#v15214f3]

-4/13

--ガイダンス

-4/20

--Chapter1 コーパス言語学の基礎 (杉山) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_1.pdf]]
--実習(1):コンコーダンサーの基礎([[AntConc:http://www.antlab.sci.waseda.ac.jp/software.html]]) (金田)
---[[AntConc日本語マニュアル:http://www.antlab.sci.waseda.ac.jp/software/antconc3.2.2_tutorial_japanese.pdf]]
---[[シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)

-4/27

--Chapter2 代表性,バランス,標本抽出 (光井) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_2.pdf]]
--実習(2):さまざまなクエリー方法(正規表現 etc.)
---[[【タグ付き】シャーロック・ホームズコーパス:http://lexicon.tufs.ac.jp/~class2009/2011wed2/holmes_tagged.zip]](英語。[[Project Gutenberg:http://www.gutenberg.org/wiki/Main_Page]]より作成)
---[[染谷先生作成レンマリスト(ハイフンなし 外部リンク):http://www.antlab.sci.waseda.ac.jp/software/e_lemma_no_hypen.zip]]

-5/11

--第4回	マークアップ(峰) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_3.pdf]] とアノテーション (パラメシワラン) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_4.pdf]]
--実習(3):品詞・構文情報を活かした検索方法
---[[TreeTagger Tagset (PDF):http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/Penn-Treebank-Tagset.pdf]]
---cf. [[Penn Treebank Tag Set:http://www.ims.uni-stuttgart.de/projekte/CorpusWorkbench/CQP-HTMLDemo/PennTreebankTS.html]]
---[[TreeTagger Online:http://web4u.setsunan.ac.jp/Website/TreeOnline.htm]]

-5/18

--パラレル&多言語コーパス (恩田) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_5.pdf]]
--実習(4):パラレルコーパスの実際 (ParaConc)
---[[読売データ>http://mastarpj.nict.go.jp/~mutiyama/jea/index-ja.html]]

-5/25

--Chapter A7 利用できるコーパスの種類 (小山内) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_7.pdf]] ※統計のセクションは飛ばします


-6/8

--COCA, BNCWeb, PIE などの紹介

-6/15

--Sketch Engine の紹介(BootCat 除く)

-6/22

--DIY Corpora (モクジュンス) ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_8.pdf]]
--コーパスの自作の方法(エディタ類の紹介+BootCat)

-6/29
--長い章ですがざっと見ておきます
--Corpora and Applied Linguistics (レポーター残り4名;一人10分程度 )
---10.2 - 10.5 (パラメシワラン)
---10.6 - 10.7 (安)
---10.8 - 10.9 (恩田)  ([[スライドPDF):http://lexicon.tufs.ac.jp/~class2009/2011wed2/CBLS_A_10_8-9.pdf]]
---10.10 - 10.12 (峰)
---10.12 - 10.15 (小山内)

-7/13
--補講の調整
--前期のまとめ:コーパスと言語研究(自分の研究の興味・関心と結び付ける)

-9月30日(予定) 206教室で2時限〜4時限の予定
--補講期間に補講を行う
--セクションC-1(辞書学) (モクジュンス)
--セクションC-2(文法・語法) (光井)
--%%セクションC-3(言語習得)%%
--%%セクションC-5(言語使用域)%%

-10月12日
--セクションC-6(英-中 パラレルコーパス)(恩田)

**ワークシート [#s3406f26]

-[[A2>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A2_worksheet.pdf]]
-[[A3>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A3_worksheet.pdf]]
-[[A4>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A4_worksheet.pdf]]
-[[A5>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A5_worksheet.pdf]]
-[[A6>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A6_worksheet.pdf]]
-[[A7>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A7_worksheet.pdf]]
-[[A8>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A8_worksheet.pdf]]
-[[A9>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A9_worksheet.pdf]]
-[[A10>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/cl/Unit_A10_worksheet.pdf]]



**その他備考など [#pc8a45a9]

-成績の評価
--出席・参加30%,テキストのまとめの発表30%,課題の提出40%

-受講上の注意
--コンピューター室での実習が半分,講義が半分となる。 
--パソコンに開発・分析環境を整えたいので,ラップトップの持参が望ましい。 
--テキストは英語なので最低限,英語文献を読む英語力が必要。

-テキスト・教材
--McEnery, T., R. Xiao and Y. Tono (2006) Corpus-Based Language Studies: An Advanced Resource Book (Routledge Applied Linguistics)
---各自でアマゾンなどで購入すること
--最初の2章分のPDFを以下に貼り付けておくので、注文を早急にして入手お願いします:
---Chap 1 [[HERE:>http://corpuscobo.net/class2011/CBLS-A1.pdf]]
---Chap 2 [[HERE:>http://corpuscobo.net/class2011/CBLS-A2.pdf]]

-メーリングリスト
--2011-tono-wed2@tufs.ac.jp (大文字@を小文字に変えてご利用ください)

----


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS