第1回 演習課題: N-Gramデータの分析
 学術論文抄録から選択した10万文を対象に、N = 7(, ・・,2,1)についてN-Gramプログラム(Cで実装)を実行します。
   入力ファイル: Corpus01-10.txt
   実行用power shell script: "N-Gram.ps1"("N-Gram.bat")
   出力ファイル: "*-Gram_frq_100K.txt" (出現頻度順)、"*-Gram_str_100K.txt" (文字コード順)
 (a) 出現頻度順(N= 7・・4)、について上位100語について表を作成します(表数:4)。
 (b) 出現頻度順ファイルについてグラフを作成します。
 (c) 特徴的な文字列を4つ(N=7, ・・4)を選び、それぞれの文字列の文字コード順、前後4文字列(9文字列)
を表にし、分析しなさい。