d
情報科学ゼミナール: 自然言語解析
日本語文解析→理解
文脈解析→質問・対話文生成、情報抽出→知識構造形成
|
◆ ゼミナール概要
前期科目「自然言語解析」では、主として日本語を対象に自然言語処理の基本となる語-文-パラグラフ(複数の文)の解析の各段階について解説しました。
また、情報科学特別演習では、同様にその最も基本的な処理である形態素解析-形態素結合-係り受け,構文解析の処理手順の詳細について説明し、当研究室で
開発中の各ツールを使用し、受講者はそれぞれの出力結果に含まれる誤解析データを分析しました。これは、日本語の特性をおよび日本語に対する自然言語解析
の問題点について理解を深めるためでありました。
本ゼミナールの前半では上述の前期2科目で扱われなかった自然言語処理研究の以下のテーマについて解説します。
(1)談話構造解析、(2)文の生成、(3)質問応答文の生成
当研究室では、コーパスとして主に学術論文、特許、技術報告書などの理工学文書、および各種工業製品の解説書・マニュアルなどを扱います。これら文書に
出現する文は、会話文・新聞記事等とは著しく異なり、専門用語および単位・化学式・数式など語以外の表現を多数含み、複文、重文、並列構造などから構成さ
れる非常に複雑な文が頻出します。
このようなコーパスに対する高精度の自然言語解析器(特に述語項解析-談話解析)および質問応答─対話文生成器の開発を意図し、後半では、前期の2科目およびゼミナール前半の内容に基づいて、3~4グループに別れ演習を行います。
■ 研究室紹介(学部・大学院)
■ 情報ゼミナール準備
3年生後期_履修科目シート
プロフィールシート
Filezilla設定ファイル
◆ 9.12 自己紹介
◆講義計画(2024年度)(予定)
期日 回数 講義内容テキスト
9.24 第 1回 演習: 述語項構造解析1(遠隔)
講義録画
10. 1 第 2回 文の生成Ⅰ(遠隔)
講義録画
10. 8 第 3回 文の生成Ⅱ(遠隔)
講義録画
10.15 第 4回 文の生成Ⅱ 続き(遠隔)
講義録画
10.22 第 5回 PythonⅠ: 関数と記述形式(main関数、データ構造)(対面)
講義録画
PythonⅠ補足: 非標準ライブラリーのインストール
main関数定義の仕方
利用者作成関数(標準関数以外)ファイルのインポート
10.29 第 6回 談話構造解析Ⅰ
講義録画
11. 5 第 7回 談話構造解析 Ⅱ
講義録画
11.12 第 8回 談話構造解析 Ⅱ 続き
講義録画
11.19 第9回 自然言語解析演習: 述語項構造解析2(対面)
講義録画
11.26 第10回 自然言語解析演習: 述語項構造解析2 進捗状況(遠隔)
入力ファイル、
サンプルメイン関数
サンプルメイン関数の実行
12. 3 第11回 自然言語解析演習2 述語項構造解析 (遠隔)(遠隔)
12.10 第12回 PythonⅡ (遠隔)
演習録画
参考:PowerShellの実行ポリシー変更
参考:デジタル署名できるPowerShellコマンドを用意した
メイン関数の仕様
演習課題
12.17 第13回 自然言語解析 演習 (遠隔):
演習録画
冬季休暇
1. 7 第14回 自然言語解析 演習 (遠隔):
演習録画
1.14 休講(「情報検索」補講のため)
1.21 Python 演習課題2(必須ではない)(遠隔)
演習録画
1.28 休講(担当者の4年生の卒研要旨提出指導のため)
■ 卒業研究開始前準備
2. 4 第1回(遠隔)Python 演習課題2(必須ではない、卒業研究テーマ(説明)
卒業研究テーマ関連図
2 10 休講(担当者の4年生の卒研発表指導のため)
2 17 第2回(遠隔)卒業研究テーマ説明、演習課題説明2
卒業研究テーマ関連図
2.24 休講(祝日)
3. 3 (遠隔:9:00) 卒業研究準備 1: 事前学修
3.10 休講
3.17 (対面:10:30) 卒業研究準備 2: 各自のNotePC環境設定等
対象者: 高瀬、薄田
(対面:13:00) 卒業研究準備 2: 環境設定、作業課題説明等
対象者: 森涼成、石渡、日下部、伊藤、柳沢(他は休講)
3.18 (対面:13:00) 卒業研究準備 2
対象者: 森睦、綾、河野、南島(他は休講)
3.24 (遠隔:9:00、全員) 卒業研究準備 3:
研究室LMS
エクセル操作
演習録画
3.31 卒業研究開始
・基本対面指導、月曜日 13:30 Aグループ
4. 1 卒業研究開始:
・基本対面指導、月曜日 13:00 Bグループ