英語学研究2009
内容 †
後期は Stefan Gries (2009) Quantitative Corpus Linguistics with R (Routledge) を読みながら、R でやるコーパス言語学の基本を一緒に習得します。
日程表 †
配布資料を参照
補足資料・ハンドアウト †
- Chapter 4
- 4.1.1 A Frequency List of an Unannotated Corpus (pp. 106-110) [藤田]
- 4.1.2 A Reverse Frequency List of an Unannotated Corpus (pp. 110-112) [後上]
- 4.1.3 A Frequency List of an Annotated Corpus (pp. 112-114) [本田]
- 4.1.4 A Frequency List of Tag-word Sequences from an Annotated Corpus (pp. 114-118) [人見]
- 4.1.5 A Frequency List of Word Pairs from an Annotated Corpus (pp. 118-124) [金田]
- 4.1.6 A Frequency List of an Annotated Corpus (with One Word Per Line) (pp. 124-126) [藤田]
- 4.1.7 A Frequency List of Word Pairs of an Annotated Corpus (with One Word Per Line) (pp. 126-127) [後上]
- 4.2.1 A Concordance of an Unannotated Text File (pp. 127-135) [本田]
- 4.2.2 A Simple Concordance from Files of a POS-tagged (SGML) Corpus (pp. 135-141) [人見]
- 4.2.3 More Complex Concordances from Files of a POS-tagged (SGML) Corpus (pp. 141-145) [金田]
- 4.2.4 A Lemma-based Concordance from Files of a POS-tagged and Lemmatized (XML) Corpus (pp. 146-149) [藤田]
スクリプト †
Chapter 1: Introduction †
- Why R?
- スクリプトは1回書けば再利用可能
- よりコントロールがきく
- ツール開発者に依存しない
- カスタマイズ可能
- プログラミング言語としての汎用性
- R ですべてできる(vs. Perl or Python)
- 本書の概要
- 2章:コーパスの概念、コーパス言語学の方法論(頻度表、コロケーション、コンコーンダンス)
- 3章:R の基本、テキスト処理の基礎
- 4章:3章の方法でコーパスを処理してみる
- 5章:統計的思考法、仮説検定などの基礎
- 6章:事例研究(実際にデータをいじってみる)
リンク †