情報科学ゼミナール: 自然言語解析
日本語文解析→理解
- 文脈解析→質問・対話文生成、情報抽出→知識構造形成 -

◆ ゼミナール概要
 前期科目「自然言語解析」では、主として日本語を対象に自然言語処理の基本となる語-文-パラグラフ(複数の文)の解析の各段階について解説しました。 また、情報科学特別演習では、同様にその最も基本的な処理である形態素解析-形態素結合-係り受け-構文解析の処理手順の詳細について説明し、当研究室で 開発中の各ツールを使用し、受講者はそれぞれの出力結果に含まれる誤解析データを分析しました。これは、日本語の特性をおよび日本語に対する自然言語解析 の問題点について理解を深めるためでありました。
 本ゼミナールの前半では上述の前期2科目で扱われなかった自然言語処理研究の以下のテーマについて解説します。
   (1)談話構造解析、(2)文の生成、(3)質問応答文の生成
 当研究室では、コーパスとして主に学術論文、特許、技術報告書などの理工学文書、および各種工業製品の解説書・マニュアルなどを扱います。これら文書に 出現する文は、会話文・新聞記事等とは著しく異なり、専門用語および単位・化学式・数式など語以外の表現を多数含み、複文、重文、並列構造などから構成さ れる非常に複雑な文が頻出します。
 このようなコーパスに対する高精度の自然言語解析器(特に述語項解析-談話解析)および質問応答─対話文生成器の開発を意図し、後半では、前期の2科目およびゼミナール前半の内容に基づいて、3~4グループに別れ演習を行います。


研究室紹介(学部・大学院)

情報ゼミナール準備     3年生後期_履修科目シート   プロフィールシート   Filezilla設定ファイル

9.12 自己紹介

講義計画(2023年度)(予定!!)
期日  回数  講義内容テキスト
9.26  第 1回 文の生成I 講義録画

10. 3 第 2回 文の生成Ⅱ 講義録画

10.10 第 3回 文の生成Ⅱ 続き
        PowerShellでのscript実行環境準備 講義録画
        参考:PowerShell のスクリプトが実行できない場合の対処方法
        参考: PowerShellの使い方

10.17 第 4回 自然言語処理における学習 演習録画

10.24 第 5回 自然言語処理における学習 続き 講義録画
        main関数定義の仕方

10.31 第 6回 談話解析Ⅰ 講義録画
        非標準ライブラリーのインストール

11. 7 第 7回 談話解析Ⅱ 演習録画

11.14 第 8回 言語理解と知識 講義録画
        利用者作成関数(標準関数以外)ファイルのインポート 講義録画

11.21 第9回 言語理解と知識 続き 演習録画
        csv file IO、表(2次元配列)処理関数(研究室作成)

11.28 第10回 演習: Python Script 作成 講義録画

12. 5 休講(12月7日の卒業研究進捗状況報告会準備のため)

12.12 第11回 演習: 演習録画
     
12.19 第12回 演習(遠隔): 演習録画
      
    冬季休暇

1. 9 第13回 PYthon 演習(対面): 演習録画
      
1.16 第14回 自然言語解析 演習 (遠隔): 演習録画
      
1.23 休講(期末試験) 演習録画

1.30 第14回 自然言語解析 演習(遠隔): 演習録画
      
2. 5 自然言語解析 演習(遠隔): 演習録画
      
2.12 休講(4年生の卒業研究発の準備のため)


■ 卒業研究開始前準備
2.19 第1回(遠隔) 開始前演習1: 演習録画

2 26 第2回(遠隔) 卒業研究テーマ説明1、開始前演習2: 演習録画


3. 4 第3回(遠隔) 卒業研究テーマ説明2、開始前演習3: 演習録画

3.11 第4回(遠隔) 開始前演習4: 演習録画

3.18 第5回(遠隔) 開始前演習5: 演習録画

3.25 休講(担当者の春季休業のため)

4. 1 第5回(遠隔) 開始前演習6: