英語学研究2012

ICCIデータを用いたn-gram抽出の分析

  • 5112104 山崎史夏
  • 担当した国:スペイン

全体とスペインとの比較

  • unigramを見ると全体はIが一番多いがスペインはtheが一番多い
    • →スペイン語は英語と同様に冠詞を持つためうまく使えているのでは?
  • 大文字から始まるTheも含めるとさらに数が多い
  • unigramのトップ3つは共通だが順番が異なる
  • filmという単語が多い
    • →テーマが「好きな映画」だった人が多い
  • favoriteとfavouriteどちらのつづりもあるが後者の方が多くみられる
  • 全体に比べて否定形がそれほど多くみられない
    • →テーマの影響か?
  • becauseが全体に比べて順位が高め
    • →「好きな映画」や「宝くじがあたったら何をするか」のテーマが多く、理由を答えなければならないからか

スペインとイスラエルの比較

  • unigramのトップ3つは共通だが順番が異なる
  • イスラエルはmitzvaという独特の単語が見られるがスペインではそのようなものがなかった
  • moneyという単語がどちらにも共通してよくみられるがテーマは異なる
  • イスラエルにはfavoriteは出てこないし、becauseも低め
  • イスラエルはyouやweなど読み手に語りかけるような表現がある(スペインにはない)

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2012-10-29 (月) 00:11:00 (4197d)