第3回 演習課題: 研究室開発 形態素結合器の誤結合分析
 学術論文抄録1万文に対し、形態素解析の正解文約9000文に対して、形態素結合を実行した結果、形態素結合器自身による誤解析は発見できなかった。しかし、誤結合文字列(複合語)はありうる。先頭500文について以下観点から誤解析箇所を特定し、誤結合の要因を分析する。

(a)誤解析個所の特定と正解析の記載
 誤結合についてC~G蘭に、以下の説明に従って値を記載する。
【誤結合析の種類】
(1)結合過多/過少
 (C欄): 結合すべきでない単語が結合されている[L]、結合すべき単語が結合されていない[S]
 (D欄)位置: 先頭[F]、末尾[R]
 (E欄)位置: 先頭[F]、末尾[R]
(2)結合後の複合語の品詞の誤り
 (F欄): [-1]
 (G欄): 正しい品詞

(b)誤結合の特徴分析
 誤解析の要因は主に以下の2種類であると考えられる。
 (1)形態素解析器の誤りに起因する(上記(1))
   (a)結合語(複合語)の先頭/末尾の単語: 品詞の誤り
   (b)結合語(複合語)の前方単語/後続単語: 品詞の誤り
 (2)形態素結合器の誤りに起因する(上記(2))
   (a)品詞付与規則の誤り
   (b)品詞付与規則が不十分(規則を追加)
(a)の結果について、(b)の観点から誤結合の要因を分析、列挙しなさい。