情報科学ゼミナール: 自然言語解析
日本語文解析→理解
- 文脈解析→質問・対話文生成、情報抽出→知識構造形成 -
|
◆ ゼミナール概要
前期科目「自然言語解析」では、主として日本語を対象に自然言語処理の基本となる語-文-パラグラフ(複数の文)の解析の各段階について解説しました。
また、情報科学特別演習では、同様にその最も基本的な処理である形態素解析-形態素結合-係り受け-構文解析の処理手順の詳細について説明し、当研究室で
開発中の各ツールを使用し、受講者はそれぞれの出力結果に含まれる誤解析データを分析しました。これは、日本語の特性をおよび日本語に対する自然言語解析
の問題点について理解を深めるためでありました。
本ゼミナールの前半では上述の前期2科目で扱われなかった自然言語処理研究の以下のテーマについて解説します。
(1)談話構造解析、(2)文の生成、(3)質問応答文の生成
当研究室では、コーパスとして主に学術論文、特許、技術報告書などの理工学文書、および各種工業製品の解説書・マニュアルなどを扱います。これら文書に
出現する文は、会話文・新聞記事等とは著しく異なり、専門用語および単位・化学式・数式など語以外の表現を多数含み、複文、重文、並列構造などから構成さ
れる非常に複雑な文が頻出します。
このようなコーパスに対する高精度の自然言語解析器(特に述語項解析-談話解析)および質問応答─対話文生成器の開発を意図し、後半では、前期の2科目およびゼミナール前半の内容に基づいて、3~4グループに別れ演習を行います。
■ 研究室紹介(学部・大学院)
■ 情報ゼミナール準備
3年生後期_履修科目シート
プロフィールシート
Filezilla設定ファイル
◆ 9.12 自己紹介
◆講義計画(2023年度)(予定!!)
期日 回数 講義内容テキスト
9.26 第 1回 文の生成I
講義録画
10. 3 第 2回 文の生成Ⅱ
講義録画
10.10 第 3回 文の生成Ⅱ 続き
PowerShellでのscript実行環境準備
講義録画
参考:PowerShell のスクリプトが実行できない場合の対処方法
参考: PowerShellの使い方
10.17 第 4回 自然言語処理における学習
演習録画
10.24 第 5回 自然言語処理における学習 続き
講義録画
main関数定義の仕方
10.31 第 6回 談話解析Ⅰ
講義録画
非標準ライブラリーのインストール
11. 7 第 7回 談話解析Ⅱ
演習録画
11.14 第 8回 言語理解と知識
講義録画
利用者作成関数(標準関数以外)ファイルのインポート
講義録画
11.21 第9回 言語理解と知識 続き
演習録画
csv file IO、表(2次元配列)処理関数(研究室作成)
11.28 第10回 演習: Python Script 作成
講義録画
12. 5 休講(12月7日の卒業研究進捗状況報告会準備のため)
12.12 第11回 演習:
演習録画
12.19 第12回 演習(遠隔):
演習録画
冬季休暇
1. 9 第13回 PYthon 演習(対面):
演習録画
1.16 第14回 自然言語解析 演習 (遠隔):
演習録画
1.23 休講(期末試験)
演習録画
1.30 第14回 自然言語解析 演習(遠隔):
演習録画
2. 5 自然言語解析 演習(遠隔):
演習録画
2.12 休講(4年生の卒業研究発の準備のため)
■ 卒業研究開始前準備
2.19 第1回(遠隔) 開始前演習1:
演習録画
2 26 第2回(遠隔) 卒業研究テーマ説明1、開始前演習2:
演習録画
3. 4 第3回(遠隔) 卒業研究テーマ説明2、開始前演習3:
演習録画
3.11 第4回(遠隔) 開始前演習4:
演習録画
3.18 第5回(遠隔) 開始前演習5:
演習録画
3.25 休講(担当者の春季休業のため)
4. 1 第5回(遠隔) 開始前演習6: