FrontPage

最新情報

  • 後期は研究課題を決めて、自分でデータ構築・検索・処理の流れを実習します。
  • Sketch Engine を授業用に使用させます。
    • ただし個人アカウントではありませんので、授業以外では無断使用は禁じます。
    • また投野研究室でライセンス料を払っているので、第三者へのユーザー名の貸与も禁じます。

Google グループのページはこちら(メーリングリスト開設)

ICCStudy

目的

後期

  • コーパスと応用言語学の各分野での研究例を概観する
    • テキスト A10 をレポート
  • 前期での概論を受けて、実際に自分なりの研究テーマを見つけて実習してみる
    • テーマの選び方は CBLS の Part C を参照。
  • Sketch Engine を使用して、多言語対応コーパスの構築法とコーパス検索技法の基礎を身につける
    • 少数言語の場合には、SkE 実装まで行かないかもしれないが、一応 raw text での検索技法は最低限身につけて欲しい。
  • 最終的に、研究レポートを学年末に提出する
    • 提出日:12日(木):投野宛、メール添付で
  • 10/8
    • 10.2. 金田
    • 10.3. 高橋
    • 10.4. 村上
  • Sketch Engine の基礎1(concordancing の説明とSkE実習1
  • 10/15
    • 10.5. 加藤
    • 10.6. 久野
    • 10.7. 野村
    • 10.9. 信国
  • 10/22
    • 10.8. 野村
    • 10.10. 高橋
  • Sketch Engine の基礎3(Word List の説明と実習)
  • 10/29
    • 10.11. 金田
    • 10.12. 村上
    • 10.13. 秋元
  • Sketch Engine の基礎4(Word Sketch の説明と実習)
  • 11/05
    • テーマの選定(簡単なやりたいことのシェアリング)
  • Sketch Engine の基礎5(WebBootCat? の説明と実習)
  • 11/12
    • テーマの選定2(簡単なやりたいことのシェアリング)
◎毎回 Section C を1つずつレポート(15分くらいで)
C1: 金田(11/12)
C2: 野村(12/3) C3: 加藤(12/3)
C4: 高橋(12/10) C5: 村上(12/10)
C6: 信国(12/17)
  • Sketch Engine の基礎6(CorpusBuilder? の説明と実習)
  • 11月後半:外語祭〜月末は自分でデータ収集・加工・分析をやってみる
  • 12月:中間報告 & SkE のそれぞれの課題に応じた活用方法を考える
  • Tree Tagger の利用
  1. TreeTagger をダウンロードする
         * http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
         * このページの下の方にある「Windows version」のリンクから tree-tagger-windows-3.1.zip をダウンロード
  2. 解凍して適当にどこかに置いておく
  3. パラメータファイルをダウンロードする
         * 同じページの「Parameter files for PC (Linux and Windows)」の中の「English parameter file」のリンクから english-par-linux-3.1.bin.gz をダウンロード
  4. 解凍してできる english.par を TreeTagger ディレクトリ以下のlibディレクトリに入れる。
  • 1〜2月:最終レポートの骨子の発表&レポート提出
レポート発表順番:
1月21日  金田  本田  信国  村上
1月28日  高橋  加藤  野村  久野  秋元
☆ 一人10分(パワーポイント用意)+5-7分ディスカッション

前期

  • コーパス言語学の基礎概念の理解
  • Global COE 若手研究者育成のための教育プログラムの一環
  • 英語によるモデル提示が中心だが、そこから他言語への展開を想定、それぞれが応用できるようにする

日時・場所

  • 水曜2時限

受講対象

  • 博士前期・後期 同時開講

スケジュール

後期

  • 10〜11月:Sketch Engine の紹介 & CBLS の Part A10, C を短くレポートする
  • 11月:SkE を利用したリサーチの提案(各自で構想を発表&ディスカッション)
  • 12〜1月:データ構築・処理などの作業を中心、中間発表を1か月に1度ずつ
  • 2月:研究レポート提出(試験はなし)

前期

  • 4〜5月:CBLS の1〜3章
  • 6月:4章前半、AntConc? の実習、annotation の紹介
  • 7月
  • 7/9
    • 4.4.4. カトウ
    • 4.4.5. ノブクニ
    • 4.4.6. アサクラ
    • 4.4.7. タカハシ
    • 4.4.8. ヒトミ
    • 4.5. ヤマダ
  • 7/16
    • 6.2. kuno
    • 6.3. akimoto
    • 6.4. murakami
    • 6.5. kaneta
  • 7/23
    • 8.2. nobukuni
    • 8.3. kato
    • 8.4. akimoto
    • 8.5.-7. asakura
    • 9 takahashi

進め方

  • テキストの内容に関する課題と発表
    • Moodle の活用
  • まとめの講義
    • 教材化する
  • 必要に応じて演習を交える
    • コンピューター環境が必要

テキスト

  • Mcenery, T., Xiao, R., & Tono, Y. (2006) Corpus-Based Language Studies: An Advanced Resource Book. UK: Routledge.
  • 全員購入すること
  • 購入までの暫定 PDF

パワーポイント

参考 URL

  • Mark-up
  • DCMI Dublin Core Metadata Initiative: Wikipedia の解説
  • OLAC Open Language Archives Community
  • CES Corpus Encoding Standard
  • Character encoding
  • Antconc
  • Brown Corpus
  • POS tagging

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2009-01-28 (水) 10:43:57 (3158d)