- 追加された行はこの色です。
- 削除された行はこの色です。
[[FrontPage]]
#contents
**最新情報 [#xf07263b]
-後期は研究課題を決めて、自分でデータ構築・検索・処理の流れを実習します。
-Sketch Engine を授業用に使用させます。
--ただし個人アカウントではありませんので、授業以外では無断使用は禁じます。
--また投野研究室でライセンス料を払っているので、第三者へのユーザー名の貸与も禁じます。
***Google グループのページはこちら(メーリングリスト開設) [#t085b9ca]
-http://groups.google.co.jp/group/tono-wed2
***ICCStudy [#lab2892d]
-http://iccstudy.tufs.ac.jp/moodle/
--こちらからログインして、授業ページへどうぞ
**目的 [#q41fb3d4]
***後期 [#cd1976ae]
-コーパスと応用言語学の各分野での研究例を概観する
--テキスト A10 をレポート
-前期での概論を受けて、実際に自分なりの研究テーマを見つけて実習してみる
--テーマの選び方は CBLS の Part C を参照。
-Sketch Engine を使用して、多言語対応コーパスの構築法とコーパス検索技法の基礎を身につける
--少数言語の場合には、SkE 実装まで行かないかもしれないが、一応 raw text での検索技法は最低限身につけて欲しい。
-最終的に、研究レポートを学年末に提出する
-10/8
--10.2. 金田
--10.3. 高橋
--10.4. 村上
---Sketch Engine の基礎1(concordancing の説明と[[SkE実習1]])
-10/15
--10.5. 加藤
--10.6. 久野
--10.7. 野村
--10.9. 信国
---Sketch Engine の基礎2([[Corpus Query Language:http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying]] の説明と[[SkE実習2]])
-10/22
--10.8. 野村
--10.10. 高橋
---Sketch Engine の基礎3(Word List の説明と実習)
-10/29
--10.11. 金田
--10.12. 村上
--10.13. 秋元
---Sketch Engine の基礎4(Word Sketch の説明と実習)
-11/05
--テーマの選定(簡単なやりたいことのシェアリング)
---Sketch Engine の基礎5(WebBootCat の説明と実習)
-11/12
--テーマの選定2(簡単なやりたいことのシェアリング)
◎毎回 Section C を1つずつレポート(15分くらいで)
C1: 金田(11/12)
C2: 野村(12/3) C3: 加藤(12/3)
C4: 高橋(12/10) C5: 村上(12/10)
C6: 信国(12/17)
---Sketch Engine の基礎6(CorpusBuilder の説明と実習)
-11月後半:外語祭〜月末は自分でデータ収集・加工・分析をやってみる
-12月:中間報告 & SkE のそれぞれの課題に応じた活用方法を考える
--Tree Tagger の利用
1. TreeTagger をダウンロードする
* http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
* このページの下の方にある「Windows version」のリンクから tree-tagger-windows-3.1.zip をダウンロード
2. 解凍して適当にどこかに置いておく
3. パラメータファイルをダウンロードする
* 同じページの「Parameter files for PC (Linux and Windows)」の中の「English parameter file」のリンクから english-par-linux-3.1.bin.gz をダウンロード
4. 解凍してできる english.par を TreeTagger ディレクトリ以下のlibディレクトリに入れる。
-1〜2月:最終レポートの骨子の発表&レポート提出
***前期 [#m8f80a25]
-コーパス言語学の基礎概念の理解
-Global COE 若手研究者育成のための教育プログラムの一環
-英語によるモデル提示が中心だが、そこから他言語への展開を想定、それぞれが応用できるようにする
**日時・場所 [#ka57dbac]
-水曜2時限
**受講対象 [#t13e13eb]
-博士前期・後期 同時開講
**スケジュール [#u18378d3]
***後期 [#eddfba07]
-10〜11月:Sketch Engine の紹介 & CBLS の Part A10, C を短くレポートする
-11月:SkE を利用したリサーチの提案(各自で構想を発表&ディスカッション)
-12〜1月:データ構築・処理などの作業を中心、中間発表を1か月に1度ずつ
-2月:研究レポート提出(試験はなし)
***前期 [#ua44f361]
-4〜5月:CBLS の1〜3章
-6月:4章前半、AntConc の実習、annotation の紹介
-7月
-7/9
--4.4.4. カトウ
--4.4.5. ノブクニ
--4.4.6. アサクラ
--4.4.7. タカハシ
--4.4.8. ヒトミ
--4.5. ヤマダ
-7/16
--6.2. kuno
--6.3. akimoto
--6.4. murakami
--6.5. kaneta
-7/23
--8.2. nobukuni
--8.3. kato
--8.4. akimoto
--8.5.-7. asakura
--9 takahashi
**進め方 [#kfffd2d6]
-テキストの内容に関する課題と発表
--Moodle の活用
-まとめの講義
--教材化する
-必要に応じて演習を交える
--コンピューター環境が必要
**テキスト [#c63bd894]
-Mcenery, T., Xiao, R., & Tono, Y. (2006) '''Corpus-Based Language Studies: An Advanced Resource Book.''' UK: Routledge.
-全員購入すること
-購入までの暫定 PDF
-ワークシート(1章)
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/Unit_A1.pdf
--第2・3章: http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CBLS_Chap2-3.pdf
-ワークシート(2章)
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/Unit_A2.pdf
-ワークシート(3章)
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/Unit_A3.pdf
**パワーポイント [#o107f7a6]
-CBLS Chapter 1
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CL_CBLS_01.ppt.pdf
-CBLS Chapter 2
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CL_CBLS_02.ppt.pdf
-CBLS Chapter 3
--http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/wed2/CL_CBLS_03.ppt.pdf
**参考 URL [#u5c1794b]
-Mark-up
--[[DCMI:http://ja.wikipedia.org/wiki/Dublin_Core]] Dublin Core Metadata Initiative: Wikipedia の解説
--[[OLAC:http://www.language-archives.org/]] Open Language Archives Community
--[[IMDI:http://www.mpi.nl/IMDI/]] ISLE Metadata Initiative; IMDI tools もある
---[[IMDI Schema (XML shema の例):http://www.mpi.nl/IMDI/schemas/xsd/IMDI_3.0.xsd]]
--[[TEI:http://www.tei-c.org/index.xml]] Text Encoding Initiative
---[[P5 Guidelines:http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html]]
---[[TEI Header:http://www.tei-c.org/release/doc/tei-p5-doc/en/html/HD.html]]
---[[Roma: generating validators for the TEI:http://www.tei-c.org/Roma/]]
--[[CES:http://www.cs.vassar.edu/CES/]] Corpus Encoding Standard
-Character encoding
--[[Unicode:http://www.unicode.org/]] Unicode Consortium
-Antconc
--[[Laurence Anthony's page:http://www.antlab.sci.waseda.ac.jp/software.html]]
--[[Tutorials by Laurence:http://www.antlab.sci.waseda.ac.jp/software/AntConc_Help_3.1.2/whnjs.htm]]
-Brown Corpus
--[[List of main categories:http://khnt.aksis.uib.no/icame/manuals/brown/INDEX.HTM#bc2]]
-POS tagging
--[[CLAWS Online Demo:http://ucrel.lancs.ac.uk/claws/trial.html]]