TonoPaper
川崎先生(東大)チュートリアル †
- スペイン語の著者・年代・地点推定
- PCA + t-SNE (次元縮約)の手法
- 時空間埋め込み関連:
- 年代を10年ごとに区切る
- 単語の前後の3語で、単語の分散表現の平均値を年代ごとに出して、時間埋め込みを学習させる?
- 71年代、次元数25、窓幅{0,1,2}
- 地点{0,1}
- Label smoothing
- one hot ベクトルの平滑化 ↔ 正則化
- sigma: hyper-parameter
- softmax 関数: ニューラルネットワークで出力が x1,x2で出てきてそれをソフトマックス関数によって確率におきかえることによって各ラベルの可能性として出力するもの
- マルチタスク学習(Goldberg, 2019)
- 言語変異
- 方言間接触
- 系列変換モデル:語順学習と世代間伝搬のモデリング