武藤?

修士論文本文(武藤)? 修士論文スライド(武藤)? 章立て(武藤)?

1. はじめに 

1.1 背景 

1.2 目的 

1.3 本論文の概要 

2. 意思決定モデルにおける予測 

2.2 意思決定によるデータ遷移の例 

2.2 時系列データの予測 

2.3 強化学習 

3. 時系列遷移と逆強化学習 

3.1 オプション価格導出の理論 

偏微分方程式離散化スキーム 

標準相補性問題(LCP) 

3.2 オプショングラフ理論 

オプション評価関数 

オプション評価導出アルゴリズム 

3.3 逆強化学習による評価関数の推定 

NGnetを用いたActor-critic法 

*** 追加予定 [#hfecab7a] -確率微分方程式(オイラー・丸山法による数値解法) --確率微分に従わない実データを使うときにどう説明するか? ** 3.3 評価関数の応用

4. 提案手法 

4.1 提案手法概要(フレームワークの説明) 

4.2 オプショングラフ理論とガウシアンミックスの組み込み 

数式的説明 

4.3 提案アルゴリズムの概要 

5. 実験結果並びに考察 

5.1 数値実験の概要 

5.2 実験結果と考察 

6. おわりに 


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS