山元さんの卒論の再現をおこなう
山元?
・python3.x
※初めてpythonをインストールするときはanacondaを使ってインストールするのがおすすめ
google driveの学生→09平松の場所にあるneologd.zip
とりあえず、ダウンロードした3D_Graph.zipを解凍する。
解凍した中身の3D_Graphを開く。※_MACOSXの方は使わない
・Server.py
サーバーを立てるメインのpythonプログラム
・matomeall.py
Server.pyとセットのプログラム。単体では動かない
・system.html
Server.pyを実行した後に開き、キーワード入力、3Dグラフを表示するもの
・miserables.json
スクレイピングして形態素分析した後のデータが記録されるファイル
・その他
特に触る必要はない
anaconda promptかcommand promptで以下のコマンドのディレクトリの部分をrequestment.txtの任意のディレクトリに変更して打ち込みpipモジュールを一括でインストールする
pip install -r C:\Users\hiram\Desktop\requirement.txt
インストールするモジュールの中にはただpip install 〇〇とやるだけではインストールできないものもある
例えば、chromedriverがそうで
https://qiita.com/hanzawak/items/2ab4d2a333d6be6ac760
を参考にするとできる
また、MeCabもそうで、pipとは別に本体をダウンロード&インストールしないといけない
https://qiita.com/menon/items/f041b7c46543f38f78f7
を参考にしてインストールする
MeCabは形態素分析を行うモジュールで、その形態素分析を行うときに使う辞書がある
デフォルトの辞書では例えば「進撃の巨人」という言葉を見ても「進撃 の 巨人」という分析結果になってしまう。
これはデフォルトの辞書には進撃の巨人という名詞が存在していないから起こってしまう
そこで、NEologdという新しい辞書を追加する
Neologdの追加の仕方は、
https://qiita.com/zincjp/items/c61c441426b9482b5a48
を参考にする
googledriveからダウンロードしたneologd.zipを使えば,辞書ファイルのコンパイルまで作業をスキップできる