英語学研究(2010年度後期)

目的

時限・場所

  • 火曜日2時限
  • 教室:206

テキスト

  • 金明哲(2009)『テキストデータの統計科学入門』(岩波書店) 各自購入のこと

進め方

  • 基本的にはチャプターごとにレポーターが内容をまとめて報告する
  • その際に、できるだけパソコン上で同様のツールを使って再現したりデモをしたりする
  • 可能であれば、全員で練習してみる
  • どうしても無理な場合には、参考例をウェブなどから探してきて紹介する
  • 投野が適宜、補足説明を行う

メーリングリスト

2010-tono-tue2@tufs.ac.jp

受講の条件

  • 出席・参加    30%
  • 分担発表      50%
  • その他課題    20%
  • レポートは各章の分担をきちんとプレゼンし報告すればよい
  • 最終課題は特に設けない

シラバス

授業計画

10/5ガイダンス & 第1章投野(PDF
10/12Tool と環境設定 (ラップトップを各自持参すること)
10/19休講
10/26第2章「テキストツールのクリーニングと関連ツール」リンダ(PDF
11/2第3章「形態素解析と構文解析」金田(PDF
11/2第4章「テキストにおける集計モデルと集計ツール」テオリン
11/9第5章「テキストにおける統計法則と指標」土肥(PDF) (Rスクリプト)
第6章「テキストにおけるネットワーク分析」星合(PDF) (Rスクリプト)
11/16第7章「テキストの探索的分析」リリ(PDF) (Rスクリプト)
11/30第8章「テキストにおける確率モデリング」高杉
12/7第9章「テキストと情報量」テオリン
12/14第10章「テキストにおける推測分析」リンダ(PDF) (Rスクリプト)
12/21第11章「テキストにおける差異の分析と特徴抽出」金田(PDF) (Rスクリプト)
1/11第12章「テキストの特徴と話題分析」星合(PDF) (Rスクリプト)
1/18第13章「テキストのクラスター分析」りり(PDF) (Rスクリプト)
1/25第14章「テキストの分類」土肥
2/1第15章「テキストの時系列分析」高杉
2/8第16章「アソシエーション分析と意味処理」

ツール類

テキストエディタ

サクラエディタを推奨、商用ならば MIFES がお薦め

Perl

Windows なら下記を。Cygwin をインストールしても使える。

形態素解析システム

実際はサポートサイトに解析済みデータがあるので絶対必要ではない。

  • 茶筅 自然言語処理ツールのリンクから
  • Breakfast(富士通):これはもう今は利用できない模様
  • すもも(NTT科学基礎研究所)

構文解析システム

集計ツール

  • MLTP これをメインで用いる

テキスト取得のためのサイト


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-01-19 (水) 14:56:51 (2463d)