[[FrontPage]]

#contents


**最新情報 [#xf07263b]

-後期は研究課題を決めて、自分でデータ構築・検索・処理の流れを実習します。
-Sketch Engine を授業用に使用させます。
--ただし個人アカウントではありませんので、授業以外では無断使用は禁じます。
--また投野研究室でライセンス料を払っているので、第三者へのユーザー名の貸与も禁じます。

***Google グループのページはこちら(メーリングリスト開設) [#t085b9ca]

-http://groups.google.co.jp/group/tono-wed2

***ICCStudy [#lab2892d]

-http://iccstudy.tufs.ac.jp/moodle/
--こちらからログインして、授業ページへどうぞ


**目的 [#q41fb3d4]

***後期 [#cd1976ae]
-コーパスと応用言語学の各分野での研究例を概観する
--テキスト A10 をレポート
-前期での概論を受けて、実際に自分なりの研究テーマを見つけて実習してみる
--テーマの選び方は CBLS の Part C を参照。
-Sketch Engine を使用して、多言語対応コーパスの構築法とコーパス検索技法の基礎を身につける
--少数言語の場合には、SkE 実装まで行かないかもしれないが、一応 raw text での検索技法は最低限身につけて欲しい。
-最終的に、研究レポートを学年末に提出する
--提出日:''12日(木):投野宛、メール添付で''

-10/8
--10.2. 金田
--10.3. 高橋
--10.4. 村上

---Sketch Engine の基礎1(concordancing の説明と[[SkE実習1]])

-10/15
--10.5. 加藤
--10.6. 久野
--10.7. 野村
--10.9. 信国

---Sketch Engine の基礎2([[Corpus Query Language:http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying]] の説明と[[SkE実習2]])  

-10/22 
--10.8. 野村
--10.10. 高橋

---Sketch Engine の基礎3(Word List の説明と実習)

-10/29
--10.11. 金田
--10.12. 村上
--10.13. 秋元

---Sketch Engine の基礎4(Word Sketch の説明と実習)

-11/05
--テーマの選定(簡単なやりたいことのシェアリング)

---Sketch Engine の基礎5(WebBootCat の説明と実習)

-11/12
--テーマの選定2(簡単なやりたいことのシェアリング)

 ◎毎回 Section C を1つずつレポート(15分くらいで)
 C1: 金田(11/12)
 C2: 野村(12/3) C3: 加藤(12/3)
 C4: 高橋(12/10) C5: 村上(12/10)
 C6: 信国(12/17)

---Sketch Engine の基礎6(CorpusBuilder の説明と実習)

-11月後半:外語祭〜月末は自分でデータ収集・加工・分析をやってみる

-12月:中間報告 & SkE のそれぞれの課題に応じた活用方法を考える

--Tree Tagger の利用

   1. TreeTagger をダウンロードする
          * http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
          * このページの下の方にある「Windows version」のリンクから tree-tagger-windows-3.1.zip をダウンロード
   2. 解凍して適当にどこかに置いておく
   3. パラメータファイルをダウンロードする
          * 同じページの「Parameter files for PC (Linux and Windows)」の中の「English parameter file」のリンクから english-par-linux-3.1.bin.gz をダウンロード
   4. 解凍してできる english.par を TreeTagger ディレクトリ以下のlibディレクトリに入れる。



-1〜2月:最終レポートの骨子の発表&レポート提出

 レポート発表順番:
 1月21日  金田  本田  信国  村上
 1月28日  高橋  加藤  野村  久野  秋元
 ☆ 一人10分(パワーポイント用意)+5-7分ディスカッション

----

***前期 [#m8f80a25]
-コーパス言語学の基礎概念の理解
-Global COE 若手研究者育成のための教育プログラムの一環
-英語によるモデル提示が中心だが、そこから他言語への展開を想定、それぞれが応用できるようにする

**日時・場所 [#ka57dbac]

-水曜2時限


**受講対象 [#t13e13eb]

-博士前期・後期 同時開講

**スケジュール [#u18378d3]

***後期 [#eddfba07]

-10〜11月:Sketch Engine の紹介 & CBLS の Part A10, C を短くレポートする

-11月:SkE を利用したリサーチの提案(各自で構想を発表&ディスカッション)

-12〜1月:データ構築・処理などの作業を中心、中間発表を1か月に1度ずつ

-2月:研究レポート提出(試験はなし)


***前期 [#ua44f361]

-4〜5月:CBLS の1〜3章

-6月:4章前半、AntConc の実習、annotation の紹介

-7月

-7/9
--4.4.4. カトウ
--4.4.5. ノブクニ
--4.4.6. アサクラ
--4.4.7. タカハシ
--4.4.8. ヒトミ
--4.5.   ヤマダ

-7/16
--6.2.  kuno
--6.3.  akimoto
--6.4.  murakami
--6.5.  kaneta

-7/23
--8.2.  nobukuni
--8.3.  kato
--8.4.  akimoto
--8.5.-7.  asakura
--9     takahashi


**進め方 [#kfffd2d6]

-テキストの内容に関する課題と発表
--Moodle の活用
-まとめの講義
--教材化する
-必要に応じて演習を交える
--コンピューター環境が必要

**テキスト [#c63bd894]

-Mcenery, T., Xiao, R., & Tono, Y. (2006) '''Corpus-Based Language Studies: An Advanced Resource Book.''' UK: Routledge.


-全員購入すること

-購入までの暫定 PDF

-ワークシート(1章)
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/Unit_A1.pdf

--第2・3章: http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CBLS_Chap2-3.pdf

-ワークシート(2章)
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/Unit_A2.pdf

-ワークシート(3章)
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/Unit_A3.pdf




**パワーポイント [#o107f7a6]

-CBLS Chapter 1
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CL_CBLS_01.ppt.pdf

-CBLS Chapter 2
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CL_CBLS_02.ppt.pdf

-CBLS Chapter 3
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CL_CBLS_03.ppt.pdf

**参考 URL [#u5c1794b]

-Mark-up

--[[DCMI:http://ja.wikipedia.org/wiki/Dublin_Core]] Dublin Core Metadata Initiative: Wikipedia の解説

--[[OLAC:http://www.language-archives.org/]] Open Language Archives Community

--[[IMDI:http://www.mpi.nl/IMDI/]] ISLE Metadata Initiative; IMDI tools もある
---[[IMDI Schema (XML shema の例):http://www.mpi.nl/IMDI/schemas/xsd/IMDI_3.0.xsd]]

--[[TEI:http://www.tei-c.org/index.xml]] Text Encoding Initiative
---[[P5 Guidelines:http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html]]
---[[TEI Header:http://www.tei-c.org/release/doc/tei-p5-doc/en/html/HD.html]]
---[[Roma: generating validators for the TEI:http://www.tei-c.org/Roma/]]

--[[CES:http://www.cs.vassar.edu/CES/]] Corpus Encoding Standard

-Character encoding

--[[Unicode:http://www.unicode.org/]] Unicode Consortium

-Antconc

--[[Laurence Anthony's page:http://www.antlab.sci.waseda.ac.jp/software.html]]

--[[Tutorials by Laurence:http://www.antlab.sci.waseda.ac.jp/software/AntConc_Help_3.1.2/whnjs.htm]]

-Brown Corpus

--[[List of main categories:http://khnt.aksis.uib.no/icame/manuals/brown/INDEX.HTM#bc2]]

-POS tagging

--[[CLAWS Online Demo:http://ucrel.lancs.ac.uk/claws/trial.html]]

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS