武藤?
(1)複数トピックの流行遷移
- 人気のキーワード(トピック)がどのように変遷していくかをモデル化
方法
オプショングラフモデル概要
- 意思決定のプロセスを権利を行使/待機するモデルで表現する方法
- アクティビティ(意思決定)の状態遷移の分析に利用可能
- 時間と空間で分解することができ,各瞬間・各ノード(アクティビティ)でのアクティビティの価値を測定することができる
オプショングラフモデル詳細
- 時間の分解
- (6)の解(Feynman-Kac解)からグラフ終端の価値を求める
- 空間の分解(サイクル構造なし)
- Feynman-Kac解から各終端アクティビティの価値を求める
- 価値が分かっているアクティビティノードのみを推移先に持つアクティビティに対して、価値を求めることが可能
- 前述の手順を逐次的に繰り返して全アクティビティの価値を求めることができる
→終端ノードの価値導出時、終端条件の値をどうやって用意するのか?
→ツイート数の集計を任意時間で切った際の最終時刻のトピックツイート数?
→これだけを初期条件で与えて、アルゴリズムを回し、当てはまりを見る?
オプショングラフモデルの適用
- 従来の「複数トピック流行遷移モデル」に適用
- 変数や制約をオプショングラフモデルのモノに置き換える
オプショングラフモデルの適用に関して
- 時間と空間に分解する意味
- Lotka–Volterra遅延微分方程式(Lorenz-Spreen, P., Mønsted, B.M. et al., 2019)
で十分複数トピックの流行遷移を見れている(パラメータ同定も確立されている)
- 時間・空間で分解する意味を考える必要
- オプションと流行遷移
- 権利の行使・待機=意識的にアクティビティを切り替える戦略を立てている
- 流行の変遷自体には意思決定が働いていないのでは?
- 生き残るための戦略を単語が考えて動いていると捉えられる?
- 確率で変遷するor人の行動で人気が勝手に流れていった=単語が意図的にそうした?
→確率制御をもっと勉強すべき
修論の目的は?
本質的な面
- 流行遷移モデルで次に流行るトピックを予測マーケティングに生かせるようにする?
→さらに細かく
技術的な面
- 複数トピック遷移モデルを作成し,未知パラメータを同定すること?
→出てくる遷移曲線のデータセット当てはまりを見る?
なぜオプショングラフを適用するのか?流行遷移との関係は?
8/7
- Lotka–Volterra方程式でも十分流行遷移はプロット可能
- しかし,あくまで人気を争い合った結果しか見えてこない
- ノードからノード(トピックからトピック)への乗り換えまでは見えてこないのではないか?
- オプショングラフのアクティビティノードからアクティビティノードへの変更でなら,人が意図的に人気トピックへの乗り換えを行っていることが見えるのではないか
- データセットはノード・エッジ表現ができて,流行変化が分かるもの
- 時系列LDAでデータセット化すれば切り替えが見えるか?
8/8
ベイズ推定_マルコフ連鎖モンテカルロ(MCMC)法 主要2つ
(1)メトロポリス-ヘイスティングズ(MH)法
- MCからparamを生成し,事後分布を導出
- 事後分布比率(∝尤度なので実質尤度比)を評価し,なるべく事後分布が大きくなる(大きいほうが有利になる)ようにparamを更新
- ランダムウォーク連鎖,独立連鎖,ハミルトニアン・モンテカルロ(HMC)法などがある
(2) ギブズ・サンプラー
- 2つの更新paramの片方をもう片方による条件確率分布から生成
- 生成したparamをもとにした条件確率分布から残りのparamを生成
- 任意回数まで片方paramからもう片方のparam生成を繰り返す
確率微分方程式を用いたSIRモデルのパラメータ推定
- SIR=常微分方程式のため、解が初期値で確定的になってしまう
- これを確率微分のドリフト項とみなし,ノイズである拡散項を加える
- 拡散項のパラメータ推定
- 式変形から伊藤の公式を適用
- 拡散係数σの近似式を導出し、最尤推定によってパラメータ決定
- ドリフト項(係数:感染率・回復率)のパラメータ推定
- 確率微分の数値計算
- オイラー・丸山法により実行
- Wiener過程増分dWは正規疑似乱数で生成
Lotka–Volterra遅延微分→オプショングラフモデル
- パラメータ推定時に確率微分に変換→無理やりオプショングラフに変換?
- 既にLotka–Volterra遅延微分でパラメータ推定法が確立しているので,わざわざ
優劣の分からない方法を適用する価値あるか?
やること
(1)
- Lotka–Volterra遅延微分に本当にノード乗り換えが見えないのか検証→原著読む
オプショングラフ3種のキャッシュフローはトピック遷移では何になるのか?
- 期間中アクティビティから出る利潤フロー=トピック浮上時の関連ツイート数の流入
- 満期終端ペイオフ=ツイートに終わりはないのでなし
- アクティビティ乗り換え時の推移コスト=別トピックに移るためのコスト≒流行に乗っかるのは無意識に近いので0?
(2)アクティビティの価値導出
- 1次元Wienerの増分:多次元に応用可能とあるが何の近似を使うか不明→四項過程など?
- 任意時刻の各ノードの価値を終端ノードから順番に計算
- 各時刻でどのキーワードとキーワードがつながっているかのグラフ構造が必要(各ノードには関連ツイート数orインプレッション数の情報あり)
- そのようなデータの存在可否は?
オプショングラフの当てはめがうまくいかないなら,別方法を検討
(3)
- LDA時系列を改善するほうがノード乗り換えに近いかも
どう置き換えていく?
データセットは?
8/22
#ref(): File not found: "研究シナリオ1.png" at page "修論研究(武藤)"
(0)マルチエージェント×ソーシャルネットワークシミュレーション
大まかな流れ
- 世の中に存在する人と人が結び付いた社会ネットワークの中で起こっている現象を微分方程式でモデル化
- 実際に現象が起こっていることが分かるデータセットを収集する。
- もしくは、自分でデータを集めて「このような傾向がある」ことを分析する
- 微分方程式をエージェント間の相互作用を表現した行列で表す。
- 作ったモデルを基にマルチエージェントシミュレーションを実行し、データセット(or分析結果)通りのことが起こっているのか検証
- 生じている現象を解決できるor全エージェントが目的の動きとなるようなフィードバック行列を考え、微分方程式の行列に加えて変更
- 再シミュレーションを行い、現象が少しでも改善できていることを示す。
社会モデルの案
- Twitterネットワーク
- 災害や感染症流行などの話題に対するユーザのツイートの動きを分析する研究が多いため
現状の課題
実データの取集
- ぴったり当てはまるデータセットがあれば良いが、ない場合はそのデータセットに依存して社会現象をモデリングすることになる
- データセットが全くない場合、自分データを集め(Twitter APIなど)データにどんな傾向があるのかを分析する必要
モデル化
- どんな微分方程式モデルを採用するか?(or自分でどう作るか?)
シミュレーション
- 作ったモデルを適切に動かせるマルチエージェントシミュレーションのライブラリの選定が必要
シミュレーション結果と実データの妥当性
- 実データ通りの傾向がシミュレーションで見出せない場合のバックアップ策が必要