英語学研究2012
ICCIデータを用いたn-gram抽出の分析 †
全体とスペインとの比較 †
- unigramを見ると全体はIが一番多いがスペインはtheが一番多い
- →スペイン語は英語と同様に冠詞を持つためうまく使えているのでは?
- 大文字から始まるTheも含めるとさらに数が多い
- unigramのトップ3つは共通だが順番が異なる
- filmという単語が多い
- favoriteとfavouriteどちらのつづりもあるが後者の方が多くみられる
- 全体に比べて否定形がそれほど多くみられない
- becauseが全体に比べて順位が高め
- →「好きな映画」や「宝くじがあたったら何をするか」のテーマが多く、理由を答えなければならないからか
スペインとイスラエルの比較 †
- unigramのトップ3つは共通だが順番が異なる
- イスラエルはmitzvaという独特の単語が見られるがスペインではそのようなものがなかった
- moneyという単語がどちらにも共通してよくみられるがテーマは異なる
- イスラエルにはfavoriteは出てこないし、becauseも低め
- イスラエルはyouやweなど読み手に語りかけるような表現がある(スペインにはない)
|