情報科学ゼミナール: 自然言語解析
日本語文解析─理解
- 文脈解析─質問・対話文生成、情報抽出─知識構造形成 -

◆ ゼミナール概要
 前期科目「自然言語解析」では、主として日本語を対象に自然言語処理の基本となる語-文-パラグラフ(複数の文)の解析の各段階について解説しました。また、情報科学特別演習では、同様にその最も基本的な処理である形態素解析-形態素結合-係り受け-構文解析の処理手順の詳細について説明し、当研究室で開発中の各ツールを使用し、受講者はそれぞれの出力結果に含まれる誤解析データを分析しました。これは、日本語の特性をおよび日本語に対する自然言語解析の問題点について理解を深めるためでありました。
 本ゼミナールの前半では上述の前期2科目で扱われなかった自然言語処理研究の以下のテーマについて解説します。
   (1)談話構造解析、(2)文の生成、(3)質問応答文の生成
 当研究室では、コーパスとして主に学術論文、特許、技術報告書などの理工学文書、および各種工業製品の解説書・マニュアルなどを扱います。これら文書に出現する文は、会話文・新聞記事等とは著しく異なり、専門用語および単位・化学式・数式など語以外の表現を多数含み、複文、重文、並列構造などから構成される非常に複雑な文が頻出します。
 このようなコーパスに対する高精度の自然言語解析器(特に述語項解析-談話解析)および質問応答─対話文生成器の開発を意図し、後半では、前期の2科目およびゼミナール前半の内容に基づいて、3~4グループに別れ演習を行います。


■ 研究室紹介(学部・大学院)

■ 情報ゼミナール準備   講義録画(7/27)  講義録画(8/3)  講義録画(9/7)  講義録画(9/14) 



◆ 計画(2021年度)(予定)
期日  回数  講義内容テキスト
9.28  第 1回 談話解析Ⅲ: 談話構造解析Ⅰ 講義録画

10. 5 第 2回 談話解析Ⅳ: 談話構造解析Ⅱ 講義録画

10.12 第 3回 文の生成Ⅰ 講義録画

10.19 第 4回 文の生成Ⅱ 講義録画

10.26 第 5回 質問応答文の生成Ⅰ 講義録画

11. 2 第 6回 質問応答文の生成Ⅱ 講義録画

11. 9 第 7回 演習テーマ説明 講義録画

11.16 第 8回 演習1 演習録画

11.23 第 9回 演習2 演習録画

11.30 第10回 演習3 演習録画

12. 7 第11回 演習4 演習録画

12.14 第12回 演習5 演習録画

12.21 第13回 演習6 演習録画

1.18  第14回 演習7 演習録画