[[FrontPage]] *英語学研究(2012年度前期)/外国語教育学研究 [#g19a5ab3] **授業の目標 [#xc08ead4] -コーパス言語学の隣接分野である自然言語処理の基礎的な概念を学び,コーパス処理のより高度な技法を学ぶ基礎とする。 -実データの処理を組み合わせて,単に理論だけでなく実践的な処理方法も学ぶ。 **テキスト [#h4703558] -Manning, C. & Shutze, H. (1999) Foundations of Statistical Natural Language Processing. MIT Press. **授業形式 [#y7e16e0b] -実際は5時限目の博士課程の授業と合体して,3-4時間かけて行う。 -特に問題がない限り,修士・博士の学生とも4/5時限を両方とも連続受講すること。 -テキストの読みこなしとデータ解析の実地訓練を組み合わせて行う予定。 ***授業日程 [#oe2a88e6] -4/17 --授業ガイダンス -4/24 --1.1 - 1.3 佐竹 -5/8 -5/15 --1.4 - 1.5 三浦 ---[[Handout>http://www.tufs.ac.jp/ts/personal/tonolab/class/2012/Chap1-B_Handout_Miura.pdf]] -5/22・29 --2.1 Mathematical foundations テオリン -6/5 --2.2 Essential Information Theory 山崎 -6/12 --3.1 Linguistic Essentials 石山 --3.2 Phrase Structure 高村 -6/19 --3.3 Semantics and Pragmatics 高村 --4 Corpus-Based Work 浅野 -6/26 --4 つづき 浅野 --5 Collocations 迎町 ---[[Web Corpus Data>http://www.tufs.ac.jp/ts/personal/tonolab/class/2012/web-corpus.zip]] ---[[Bigram Data>http://www.tufs.ac.jp/ts/personal/tonolab/class/2012/bigram.txt]] ***参考資料 [#ec4202c9] -Zipf's Law --[[Tom Sawyer の頻度ファイル>http://corpuscobo.net/class2012/tom_sawyer_wc.csv]] --[[Tom Sawyer の頻度Xランクの分析用エクセルファイル>http://corpuscobo.net/class2012/tom_sawyer_wc.xlsx]] --[[頻度とランクのプロットを出す R スクリプト>http://corpuscobo.net/class2012/zipf_lm.R]] --[[Tom Sawyer の両対数グラフ>http://corpuscobo.net/class2012/Zipf_lm_tom.pdf]]