武藤?

交差検証によるパラメータ調整 

データ分割・調整手順 

1. train・testに分割 

2. K分割交差検証によって,trainを"調整用train"・"検証データ"に分割 

"調整用train"と"検証データ"の分割をK回実行する

3. 1つのパラメータ組み合わせに対して,K通りの「"調整用train"に対する"検証データ"スコア」を算出し,平均化 

4. 平均スコアが最も高いパラメータで学習モデル構築 

GridSearchCVの場合,「.best_estimator_」の中に最適パラメータのモデルが入っているため,これを用いる.

PipeLineなしの場合
gscv = GridSearchCV(estimator(学習器), param_grid(辞書式パラメータリスト), 
       scoring(f1_macro/f1_microなど), cv(Kの数), verbose = 1)
gscv.fit(trainX, trainY)  # 自動的にK通りの"調整用train"・"検証データ"の組み合わせで各パラメータパターンの平均スコアが算出
gscvBM = gscv.best_estimator_
print(gscvBM.score(testX, testY))  # testデータに対する評価

*1


*1

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS