2026年4月16日
ロシア語ナショナルコーパスを使ってみよう!
ロシア語ナショナルコーパス(Национальный корпус русского языка, URL: https://ruscorpora.ru/en/ (英語版))とは,ロシア科学アカデミーが作成した,テキストや発話が大規模に集積された無料で利用できるデータベースです.このコーパスは,2003年に公開されました.文学小説や新聞などのテキストからデータを収集し,現在(2025年4月)では,20億トークン(テキストを意味のある最小単位に分割したもの)以上が収録されています.収録されたテキストや発話には,形態的な情報や意味情報などが付与されています。
ロシア語ナショナルコーパスでは,ロシア語の例文を集めたり,ロシア語の方言差や他の言語との比較ができます.












