[[FrontPage]] *英語学研究2015(春学期・秋学期) [#h9345c03] -学習者コーパスの研究手法 -教室:206(PC教室) **目的 [#y502b7f8] -学習者コーパスの作成方法を概観する -既存の学習者コーパスの特徴の理解 -具体的な研究テーマの事例を数多くみる -学習者コーパスを実際に検索プログラムで操作してみる -最終レポートで自分なりのミニリサーチを行ってみる **授業内容 [#qdb22480] -テキスト,全体のカバーする内容は2014年度とそれほど変わらないが,今年度はテキストは担当者にパワポで口頭発表風に解説してもらい,そのかわり関連分野の英語の論文を追加で読んでもらい,データ処理の実際ももう少し詳しく解説をしたい。 **授業内容 [#bd788183] 4/ 7 第1回:学習者コーパスの構築・分析・応用 (講義) 4/14 第2回:ICLE (2.2), LINDSEI (3.2) の発表 (ローレンス)(金光)+ディスカッション + Reading assignment 4/21 第3回:ICLE, LINDSEI を使った分析の実習 4/28 第4回:NICE (4.2, 5.2)の発表 (岡野)(川本)+ディスカッション + Reading assignment 5/12 第5回:NICE を使った分析の実習 5/19 第6回:JEFLL (6.2, 6.3)の発表 ( 高橋亮 )( 高橋有加 )+ディスカッション + Reading assignment 5/26 第7回:JEFLL を使った分析の実習 6/ 2 第8回:ICCI (7.2, 7.3) の発表 ( リ・ブン )( コウ・レイガ ) +ディスカッション + Reading assignment 6/ 9 第9回:ICCI を使った分析の実習 6/16 第10回:NICT JLE (8.2, 9.2) の発表 ( ローレンス )( コウ )+ディスカッション + Reading assignment 6/23 第11回:NICT JLE を使った分析の実習 6/30 天津(中国)に招待講演のため休講 7/ 7 第12回:未定 **受講の心得 [#r385d0e5] -単にテキストを表面的に読むだけではなく,自分で学習者のどのような言語特徴を観察したいかを主体的に考えて,それに応じた研究手法を選べるようにする -授業外でデータをいじらないと身につかないので,実習の作業に関してはできるだけ前後に自分で予習復習の時間を設ける **テキスト [#oe8c242b] -投野由紀夫・金子朝子・杉浦正利・和泉絵美(編著)(2013)『英語学習者コーパス活用ハンドブック』(大修館書店) -[[コンパニオン・サイト(正誤表など)>http://learnercorpus.sakura.ne.jp/contents/]] **使用するコーパス [#r5327c05] -[[Sketch Engine>https://the.sketchengine.co.uk]] --現在学内で IP auth でアクセス可能 --受講者には学外からアクセス可能な user/pwd を通知します --一部の研究室内利用の学習者コーパスにアクセスできます **Reading assignmentとタスク [#b4d06a5b] -6月16日 --Reading:[[Abe(2007)>http://www1.tcue.ac.jp/home1/k-gakkai/ronsyuu/ronsyuukeisai/49_3.4/abema.pdf]] --NICT JLE データの加工 ---interviewer と interviewee の発話を取り出す ---header 部分など不要部分を除外する --[[分析用データ>http://www.tufs.ac.jp/ts/personal/corpuskun/data/nict_practice.zip]] --コレスポンデンス(対応)分析:最近開発されたパッケージ "ca" を使います ---[[対応分析解説(金名哲氏)>http://www1.doshisha.ac.jp/~mjin/R/26/26.html]] ---Simple, multiple, and joint correspondence analysis -6月9日 --Reading は割愛 ---IJCL special issue を閲覧しておいてください --Linear Regression, Multiple Regression の基礎的な処理演習 ---[[ICCI (分析用データ3000件)>http://www.tufs.ac.jp/ts/personal/corpuskun/data/icci_practice.zip]] ---pwd: いつものやつ ---ComplexityMeasure ---R script 同梱 ---linear regression, multiple regression, model selection by AIC -5月19日 & 5月26日 --Reading: [[Native language detection (Brooke & Hirst 2013)>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/2015/assignment03.pdf]] --次回は n-gram の統計処理の基礎をやってみます --使用データ ---[[JEFLL (抜粋版)>http://www.tufs.ac.jp/ts/personal/corpuskun/data/JEFLL-plain.zip]] --使用予定のツール ---[[kfNgram>http://www.kwicfinder.com/kfNgram/kfNgramHelp.html]] ---[[MLTP>http://osdn.jp/projects/sfnet_mltp/]] -4月28日&5月12日 --Reading:[[Sugiura et al. (2007)>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/2015/assignment02.pdf]] ---杉浦先生はこの論文を CL2007 から掲載削除希望されていますが、手法を学ぶという意味で利用させてもらっています --Data:[[NICE2.2>http://sgr.gsid.nagoya-u.ac.jp/wordpress/?page_id=659]] --データは SkE では作りにくいので、配布します ---[[配布データ(zip パスワード付) >http://www.tufs.ac.jp/ts/personal/corpuskun/data/NICE-LDA.zip]] --タスク ++Type ++Token ++Type/token ratio (TTR) ++Number of sentences (Ss) ++Average Word Length (AWL) ++Average Sentence Length (ASL) --判別分析のいろいろな手法とその比較 ---[[解説用 PDF>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/2015/DiscriminantAnalysis.pdf]] ---[[判別分析の基礎(LDA)>http://www.r-bloggers.com/computing-and-visualizing-lda-in-r/]] ---[[高度な手法>http://www.r-bloggers.com/a-brief-look-at-mixture-discriminant-analysis/]] ---[[手法の比較(東大大森先生)>http://lbm.ab.a.u-tokyo.ac.jp/~omori/kensyu/discriminant.htm]] -4月14&21日 --Reading:[[Guilquin & Granger (2011)>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/2015/assignment01.pdf]] ---"into" という前置詞の使い方を通して ICLE と NS corpus を比較しながら EFL, ESL の境目を論じる論文 ---コーパス処理はそれほど難しくないが,ESL vs EFL のような目の付け所や story-telling のうまさを学んでほしい --タスク (Sketch Engine 使用) ---[[Task Handout>http://www.tufs.ac.jp/ts/personal/corpuskun/pdf/2015/Task01-into.pdf]] ++ICLEサブコーパスから into の用例を検索し、10万語の相対頻度で比較する ++intoを含む以下の統語構造を検索をする +++「名詞+into」 +++「自動詞+into」 +++「他動詞+into」 ++頻度の検定の基礎(対数尤度比 Log-likelihood ratio) +++[[LL Calculator>http://ucrel.lancs.ac.uk/llwizard.html]] ++「自動詞+into」「他動詞+into」の語彙的要素の比較をする