情報科学発展演習: 自然言語解析器を用いた実験

◆   演習概要
 本科目は、 「自然言語解析」の演習版です。したがって履修者が同期開講の自然言語解析を履修していることを前提としています(履修していないと以下の説明の内容を理解することは困難です)。
 本演習では、当研究室で研究・開発中の以下の日本語自然言語解析器((1)~(5))の出力結果を用いた演習を行います。
  (1)形態素解析器、(2)形態素結合器、(3)構文-係り受け解析器、(4)項構造解析器、(5)照応解析器
 以下の講義計画に記したように、それぞれの解析機構について詳細な説明をします。 理工学分野の文書中にテキスト(例えば10000文)を対象に、当研究室設置のPCで(1)~(3)を実行し、出力結果(ファイル)を提示します。
 現時点では、(1)~(3)の解析精度は90~99%ですので、それぞれの出力結果は100~1000の誤解析を含むことになります。(1)~(3)それぞれについて、これらの誤解析文のうち、50~100文(/1人)について受講者が誤解析結果を分析し、その要因の検討、改善案の提示が課題です。この要因分析-改善案提案によって、日本語文の特性、日本語文解析器の問題点について理解を深めることが本演習の主眼です。


◆ 講義計画(2025年度)
 期日 回数  講義内容
 5.28 第 1回 形態素解析器Ⅰ  講義録画

 6. 4 第 2回 形態素解析器Ⅱ  講義録画


 6.11 第 3回 形態素解析器Ⅲ  講義録画
         演習課題(提出期限:)

 6.18 第 4回 形態素結合器  講義録画
         演習課題(提出期限:)

 6.25 第 5回 構文解析器Ⅰ  講義録画

 7. 2 第 6回 構文解析器Ⅱ   講義録画
         演習課題(提出期限:)

 7. 9 第 7回 照応解析器  講義録画
         演習課題(提出期限:)


参考書: 「自然言語解析」に準ずる
出席・レポート・評価