3章 p.108-126

3.1 AI を文章(テキスト)に活用しよう

3.2 好きな文章を WordCloud/Word2Vec を使って可視化する

WordCloudを使った可視化 p.108-119

教師データの準備

青空文庫からデータをロードする。

Windows に wget コマンドをインストールするのは面倒なので、ブラウザを使ってアクセスし Google Drive 上にデータをダウンロードする。

アクセス先のURL: https://github.com/aozorabunko/aozorabunko/raw/master/cards/000096/files/2093_ruby_28087.zip

Google Drive: 'マイドライブ/DeepLearning/dl_book15/local/aozorabunko/




zipファイルを展開して Google Drive 上に 'マイドライブ/DeepLearning/dl_book15/local/aozorabunko/2093_ruby_28087/dogura_magura.txt' というパスでファイルにアクセスできるものとする。 このファイルは Shift_JIS でエンコードされていて、改行コードが CR LF (0x0d, 0x0a) のファイルだそうだ。

GoogleDriveをマウントする

テキストファイルについて調べる

テキストファイルを読み込む

データの前処理

形態素解析を行う。

WordCloud による可視化