英語学研究2012
ICCI n-gramの考察:イスラエルと全体の比較 †
- “mitzva”という語が頻出。成人式(Bar Mitzvah)の関連と考えられるが、トピックの内訳を見ると、Birthdayというトピックでのテクストは2つしかない。このことから、他のトピックでも誕生日や成人式の話題がよく語られていると推測される。
- 1-gramで小文字から始まるbecause (rank 52, 380 tokens)が上位にあることから、becauseを用いた複文が多く使用されていると考えられる。しかし、それと同時に小文字のiが観察される (1-gramで”i”が712 tokens、2-gramで”and i”、”i eat”が107 tokensずつ)ことから、文頭や一人称を小文字で書いている可能性がある。3-gramでは小文字のiはほとんど見られない (“i want to”が19 tokens)。
- “・”という記号が多いが、何を示しているのかわからない。
- 全体ではin the morning (1641 tokens)に対してIn the morning (116 tokens)であったが、イスラエルではin the morning (102 tokens)に対しIn the morning (64 tokens)であり、大文字で始まる割合が高い。日本語 (「今朝、」)同様、副詞節から文を始める傾向があるのかもしれない。
- Moneyというトピックのテクストが多いため、“money”が頻出 (1-gramで784 tokens、2-gramで”the money”が334 tokensなど)。買いそうなものは、”new computer” (64 tokens)の他、newとの共起でguitar、bike、phone、car などがあった。
|