引継ぎ(島崎)

環境 

Python 3.10.10 64bitで行う(他でも可) ※sklearnの対応versionがあるので調べてinstallする

準備 

ChromeDriverのインストール 

まず、ChromeDriverをインストールする.自身のGoogleChromeのバージョンを確認し,それに合ったバージョンをインストールする. https://chromedriver.chromium.org/downloads zipファイルのapplicationをダウンロードして解凍する.

インストール 

applictationの中のpracticeの中にあるappli_2.pyを実行する.

インストールできていないモジュールをpip installする.

また、UMAPのインストールは pip install umap-learn

MeCabのインストールは pip install mecab-python3

termextractのインストールはhttp://gensen.dl.itc.u-tokyo.ac.jp/pytermextract のサイト通りに実行してインストールをする.

termextract.core2はtermextractのモジュールを変更するので

\\import termextract

print(termextract.__path__)\\ と実行しtermextractのモジュールの場所にcore2を作成する.

CORE2の作成 

coreをコピーしてcore2を作成し、 import decimalを追加する.

264行目のimportanceの計算にdecimalを追加する.(decimalがないと桁がおかしくなりエラーが起こる)

動作実験 

ここまでインストールが終わると実行に入る. 実行して成功しているとこのような画面が表示される(127.0.0.1:5000)

(※)実行してサイトのアドレスを入力したあとlocal:5000を入力する.(これを入力しないとエラーが発生するかもしれない)

1.jpg

このような画面になると検索欄に検索することができる. 試しに「北陸電力 電圧」と入力してみると

2.jpg

このように表示されると成功している. クラス数を選択すると、3Dグラフや2Dグラフが作成されるので実行してみる. またこのような画面にならずに

3.jpg

のようなエラーが起きてしまう場合がある.

この場合は、しっかりと前の手順に戻ってインストールが成功しているかを確認する.

課題 

クラスタリングの外れ値の強いものに変える.

クラスタリングの外れ値に強いものとのしてk-medoidsがある. https://www.dskomei.com/entry/2018/04/03/004543 このサイトを参考にk-medoidsを定義する. k-meansはsklearnにあるがk-medoidsはないので自分で定義する必要がある.

7.jpg
8.jpg

このような関数を定義する. 実行画面はk-meansと実行画面などは同じだが外れ値に強いものとなっている.


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS