英語学研究2009

内容

後期は Stefan Gries (2009) Quantitative Corpus Linguistics with R (Routledge) を読みながら、R でやるコーパス言語学の基本を一緒に習得します。

日程表

配布資料を参照

補足資料・ハンドアウト

Chapter 4

修正ファイル補足

  • 日本語環境用修正版読み込みファイル (BNC baby) @4.2.4 (p.146-149)
    • シングルクォーテーションマークが文字化けしているのを正しく変換しました。
    • 2バイト文字の £ を GBP に変換しました。
    • おそらく度量衡の記号と思われる個所の文字化けを、 CRD に変換しました。
    • 推測不可能な文字化けを、lemma=unid, word=XXXに変換しました(1813行目)。

Chapter 3

Chapter 2

スクリプト

Chapter 1: Introduction

  • Why R?
    • スクリプトは1回書けば再利用可能
    • よりコントロールがきく
    • ツール開発者に依存しない
    • カスタマイズ可能
    • プログラミング言語としての汎用性
    • R ですべてできる(vs. Perl or Python)
  • 本書の概要
    • 2章:コーパスの概念、コーパス言語学の方法論(頻度表、コロケーション、コンコーンダンス)
    • 3章:R の基本、テキスト処理の基礎
    • 4章:3章の方法でコーパスを処理してみる
    • 5章:統計的思考法、仮説検定などの基礎
    • 6章:事例研究(実際にデータをいじってみる)

リンク


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-01-31 (日) 15:41:29 (5369d)