武藤?

Python関連 

R言語関連 ←KEGG pathway(KGML)の解析用 

Jupyter Notebook関連 

Beamer用TeXコマンド 

研究室関係 

Blockly関係 





Jupyterを使ったWEBテキストマイニング 

WEBサイトの検索結果に出てくるサイトから文章をスクレイピング+自然言語処理(形態素解析)し、3Dグラフを作る

以下の手順に従って進めていく 

添付フォルダのダウンロード 

フォルダ内のファイルについて

pythonからjupyterインストール 

(anacondaを使ってる場合はanacondaから開く)

Webスクレイピング 

何かのモジュールがないと出るたびにpipで入れていく


◎4行目について

3DGraph2.png



この後もファイルの保存・呼び出しで、パスを指定する箇所がいくつかあるが、 1番下のファイル名は変えず、C:からWebsc3Dまでを自分のものに変更していく



形態素解析、共起頻度計算 

形態素解析:文章を意味のある最小単位の単語(形態素)に分解して分析する(自然言語処理の一種)



インストールしたMecabには古い辞書しか入っていないので、NEologdという新しい辞書を追加する


例えば、単語'あ'の次に'う'が来ているので隣接行列の'あ'行'う'列の要素に+1される
(文章中の単語'あ'から'う'が1回共起されたとみなす)

Jupyterで3Dグラフを開く 


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS