#author("2024-02-29T00:46:53+00:00","","")
#author("2024-03-08T00:55:52+00:00","","")
[[引継ぎ(島崎)]]
*環境 [#h82a02b0]
#ref(application.7z)
Python 3.10.10 64bitで行う(他でも可)
※sklearnの対応versionがあるので調べてinstallする
**準備 [#j661bc61]
***ChromeDriverのインストール [#j661bc61]
まず、ChromeDriverをインストールする.自身のGoogleChromeのバージョンを確認し,それに合ったバージョンをインストールする.
https://chromedriver.chromium.org/downloads
zipファイルのapplicationをダウンロードして解凍する.
*インストール [#ve10e461]
applictationの中のpracticeの中にあるappli_2.pyを実行する.

インストールできていないモジュールをpip installする.

また、UMAPのインストールは pip install umap-learn

MeCabのインストールは pip install mecab-python3

termextractのインストールはhttp://gensen.dl.itc.u-tokyo.ac.jp/pytermextract のサイト通りに実行してインストールをする.

termextract.core2はtermextractのモジュールを変更するので

\\import termextract

print(termextract.__path__)\\
と実行しtermextractのモジュールの場所にcore2を作成する.

*CORE2の作成 [#k2b48d18]

coreをコピーしてcore2を作成し、 import decimalを追加する.

264行目のimportanceの計算にdecimalを追加する.(decimalがないと桁がおかしくなりエラーが起こる)

*動作実験 [#j2f6f08f]
ここまでインストールが終わると実行に入る.
実行して成功しているとこのような画面が表示される(127.0.0.1:5000)

(※)実行してサイトのアドレスを入力したあとlocal:5000を入力する.(これを入力しないとエラーが発生するかもしれない)
#ref(1.jpg)

このような画面になると検索欄に検索することができる.
試しに「北陸電力 電圧」と入力してみると

#ref(2.jpg)
このように表示されると成功している.
クラス数を選択すると、3Dグラフや2Dグラフが作成されるので実行してみる.
またこのような画面にならずに
#ref(3.jpg)
のようなエラーが起きてしまう場合がある.

この場合は、しっかりと前の手順に戻ってインストールが成功しているかを確認する.

*課題 [#xb0a0495]
クラスタリングの外れ値の強いものに変える.


クラスタリングの外れ値に強いものとのしてk-medoidsがある.
https://www.dskomei.com/entry/2018/04/03/004543
このサイトを参考にk-medoidsを定義する.
k-meansはsklearnにあるがk-medoidsはないので自分で定義する必要がある.
k-medoidsはk-meansでは距離の総和を二乗しているがk-medoidsは距離の総和を最小化している.
#ref(7.jpg)
#ref(8.jpg)
このような関数を定義する.
実行画面はk-meansと実行画面などは同じだが外れ値に強いものとなっている.

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS