案1. 複数トピックの流行遷移
の編集
Top
/
案1. 複数トピックの流行遷移
[
トップ
] [
編集
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
島部/menu/template
[[修論研究(武藤)]] #contents * 複数トピックの流行遷移 [#r0f0e1d2] -人気のキーワード(トピック)がどのように変遷していくかをモデル化 ** 方法 [#j84b5da1] *** オプショングラフモデル概要 [#e642bf82] #ref(オプショングラフモデルとその解法.pdf,,参考論文); -意思決定のプロセスを権利を行使/待機するモデルで表現する方法 -アクティビティ(意思決定)の状態遷移の分析に利用可能 -時間と空間で分解することができ,各瞬間・各ノード(アクティビティ)でのアクティビティの価値を測定することができる *** オプショングラフモデル詳細 [#e642bf82] -時間の分解 --(6)の解(Feynman-Kac解)からグラフ終端の価値を求める -空間の分解(サイクル構造なし) --Feynman-Kac解から各終端アクティビティの価値を求める --価値が分かっているアクティビティノードのみを推移先に持つアクティビティに対して、価値を求めることが可能 --前述の手順を逐次的に繰り返して全アクティビティの価値を求めることができる →終端ノードの価値導出時、終端条件の値をどうやって用意するのか?~ →ツイート数の集計を任意時間で切った際の最終時刻のトピックツイート数?~ →これだけを初期条件で与えて、アルゴリズムを回し、当てはまりを見る? *** オプショングラフモデルの適用 [#n5fbd3bd] -従来の「複数トピック流行遷移モデル」に適用 -変数や制約をオプショングラフモデルのモノに置き換える *** オプショングラフモデルの適用に関して [#l5888def] -時間と空間に分解する意味 --Lotka–Volterra遅延微分方程式(Lorenz-Spreen, P., Mønsted, B.M. et al., 2019) で十分複数トピックの流行遷移を見れている(パラメータ同定も確立されている) --時間・空間で分解する意味を考える必要 -オプションと流行遷移 --権利の行使・待機=意識的にアクティビティを切り替える戦略を立てている --流行の変遷自体には意思決定が働いていないのでは? --生き残るための戦略を単語が考えて動いていると捉えられる? --確率で変遷するor人の行動で人気が勝手に流れていった=単語が意図的にそうした?~ →確率制御をもっと勉強すべき ** 修論の目的は? [#v8f825fc] *** 本質的な面 [#n25222e4] -流行遷移モデルで次に流行るトピックを予測マーケティングに生かせるようにする?~ →さらに細かく *** 技術的な面 [#n637f77c] -複数トピック遷移モデルを作成し,未知パラメータを同定すること?~ →出てくる遷移曲線のデータセット当てはまりを見る? ** なぜオプショングラフを適用するのか?流行遷移との関係は? [#hf16eeda] *** 8/7 [#adff25dd] -Lotka–Volterra方程式でも十分流行遷移はプロット可能 -しかし,あくまで人気を争い合った結果しか見えてこない -ノードからノード(トピックからトピック)への乗り換えまでは見えてこないのではないか? -オプショングラフのアクティビティノードからアクティビティノードへの変更でなら,人が意図的に人気トピックへの乗り換えを行っていることが見えるのではないか --データセットはノード・エッジ表現ができて,流行変化が分かるもの --時系列LDAでデータセット化すれば切り替えが見えるか? *** 8/8 [#sbfcc3d6] *** ベイズ推定_マルコフ連鎖モンテカルロ(MCMC)法 主要2つ [#b40b6261] (1)メトロポリス-ヘイスティングズ(MH)法 -MCからparamを生成し,事後分布を導出 -事後分布比率(∝尤度なので実質尤度比)を評価し,なるべく事後分布が大きくなる(大きいほうが有利になる)ようにparamを更新 -ランダムウォーク連鎖,独立連鎖,ハミルトニアン・モンテカルロ(HMC)法などがある (2) ギブズ・サンプラー -2つの更新paramの片方をもう片方による条件確率分布から生成 -生成したparamをもとにした条件確率分布から残りのparamを生成 -任意回数まで片方paramからもう片方のparam生成を繰り返す *** 確率微分方程式を用いたSIRモデルのパラメータ推定 [#qf257395] #ref(確率微分方程式を用いたSIR解法とその応用.pdf,,参考); -SIR=常微分方程式のため、解が初期値で確定的になってしまう --これを確率微分のドリフト項とみなし,ノイズである拡散項を加える -拡散項のパラメータ推定 --式変形から伊藤の公式を適用 --拡散係数σの近似式を導出し、最尤推定によってパラメータ決定 -ドリフト項(係数:感染率・回復率)のパラメータ推定 --SIRで用いられる後退差分式を用いて最尤推定 -確率微分の数値計算 --オイラー・丸山法により実行 --Wiener過程増分dWは正規疑似乱数で生成 *** Lotka–Volterra遅延微分→オプショングラフモデル [#ec2ecfd5] -パラメータ推定時に確率微分に変換→無理やりオプショングラフに変換? --既にLotka–Volterra遅延微分でパラメータ推定法が確立しているので,わざわざ 優劣の分からない方法を適用する価値あるか? *** やること [#r281adf7] *** (1)[#g529dd02] -Lotka–Volterra遅延微分に本当にノード乗り換えが見えないのか検証→原著読む *** オプショングラフ3種のキャッシュフローはトピック遷移では何になるのか? [#a78b433a] -期間中アクティビティから出る利潤フロー=トピック浮上時の関連ツイート数の流入 -満期終端ペイオフ=ツイートに終わりはないのでなし -アクティビティ乗り換え時の推移コスト=別トピックに移るためのコスト≒流行に乗っかるのは無意識に近いので0? *** (2)アクティビティの価値導出 [#a4f05358] -1次元Wienerの増分:多次元に応用可能とあるが何の近似を使うか不明→四項過程など? -任意時刻の各ノードの価値を終端ノードから順番に計算 --そのときのトピックの人気度が見える? -各時刻でどのキーワードとキーワードがつながっているかのグラフ構造が必要(各ノードには関連ツイート数orインプレッション数の情報あり) --そのようなデータの存在可否は? オプショングラフの当てはめがうまくいかないなら,別方法を検討 *** (3)[#n3f41665] -LDA時系列を改善するほうがノード乗り換えに近いかも --LDA時系列の論文を読む ** どう置き換えていく? [#i247644e] ** データセットは? [#q594c2ce] ** [#c5ee6c9e]
タイムスタンプを変更しない
[[修論研究(武藤)]] #contents * 複数トピックの流行遷移 [#r0f0e1d2] -人気のキーワード(トピック)がどのように変遷していくかをモデル化 ** 方法 [#j84b5da1] *** オプショングラフモデル概要 [#e642bf82] #ref(オプショングラフモデルとその解法.pdf,,参考論文); -意思決定のプロセスを権利を行使/待機するモデルで表現する方法 -アクティビティ(意思決定)の状態遷移の分析に利用可能 -時間と空間で分解することができ,各瞬間・各ノード(アクティビティ)でのアクティビティの価値を測定することができる *** オプショングラフモデル詳細 [#e642bf82] -時間の分解 --(6)の解(Feynman-Kac解)からグラフ終端の価値を求める -空間の分解(サイクル構造なし) --Feynman-Kac解から各終端アクティビティの価値を求める --価値が分かっているアクティビティノードのみを推移先に持つアクティビティに対して、価値を求めることが可能 --前述の手順を逐次的に繰り返して全アクティビティの価値を求めることができる →終端ノードの価値導出時、終端条件の値をどうやって用意するのか?~ →ツイート数の集計を任意時間で切った際の最終時刻のトピックツイート数?~ →これだけを初期条件で与えて、アルゴリズムを回し、当てはまりを見る? *** オプショングラフモデルの適用 [#n5fbd3bd] -従来の「複数トピック流行遷移モデル」に適用 -変数や制約をオプショングラフモデルのモノに置き換える *** オプショングラフモデルの適用に関して [#l5888def] -時間と空間に分解する意味 --Lotka–Volterra遅延微分方程式(Lorenz-Spreen, P., Mønsted, B.M. et al., 2019) で十分複数トピックの流行遷移を見れている(パラメータ同定も確立されている) --時間・空間で分解する意味を考える必要 -オプションと流行遷移 --権利の行使・待機=意識的にアクティビティを切り替える戦略を立てている --流行の変遷自体には意思決定が働いていないのでは? --生き残るための戦略を単語が考えて動いていると捉えられる? --確率で変遷するor人の行動で人気が勝手に流れていった=単語が意図的にそうした?~ →確率制御をもっと勉強すべき ** 修論の目的は? [#v8f825fc] *** 本質的な面 [#n25222e4] -流行遷移モデルで次に流行るトピックを予測マーケティングに生かせるようにする?~ →さらに細かく *** 技術的な面 [#n637f77c] -複数トピック遷移モデルを作成し,未知パラメータを同定すること?~ →出てくる遷移曲線のデータセット当てはまりを見る? ** なぜオプショングラフを適用するのか?流行遷移との関係は? [#hf16eeda] *** 8/7 [#adff25dd] -Lotka–Volterra方程式でも十分流行遷移はプロット可能 -しかし,あくまで人気を争い合った結果しか見えてこない -ノードからノード(トピックからトピック)への乗り換えまでは見えてこないのではないか? -オプショングラフのアクティビティノードからアクティビティノードへの変更でなら,人が意図的に人気トピックへの乗り換えを行っていることが見えるのではないか --データセットはノード・エッジ表現ができて,流行変化が分かるもの --時系列LDAでデータセット化すれば切り替えが見えるか? *** 8/8 [#sbfcc3d6] *** ベイズ推定_マルコフ連鎖モンテカルロ(MCMC)法 主要2つ [#b40b6261] (1)メトロポリス-ヘイスティングズ(MH)法 -MCからparamを生成し,事後分布を導出 -事後分布比率(∝尤度なので実質尤度比)を評価し,なるべく事後分布が大きくなる(大きいほうが有利になる)ようにparamを更新 -ランダムウォーク連鎖,独立連鎖,ハミルトニアン・モンテカルロ(HMC)法などがある (2) ギブズ・サンプラー -2つの更新paramの片方をもう片方による条件確率分布から生成 -生成したparamをもとにした条件確率分布から残りのparamを生成 -任意回数まで片方paramからもう片方のparam生成を繰り返す *** 確率微分方程式を用いたSIRモデルのパラメータ推定 [#qf257395] #ref(確率微分方程式を用いたSIR解法とその応用.pdf,,参考); -SIR=常微分方程式のため、解が初期値で確定的になってしまう --これを確率微分のドリフト項とみなし,ノイズである拡散項を加える -拡散項のパラメータ推定 --式変形から伊藤の公式を適用 --拡散係数σの近似式を導出し、最尤推定によってパラメータ決定 -ドリフト項(係数:感染率・回復率)のパラメータ推定 --SIRで用いられる後退差分式を用いて最尤推定 -確率微分の数値計算 --オイラー・丸山法により実行 --Wiener過程増分dWは正規疑似乱数で生成 *** Lotka–Volterra遅延微分→オプショングラフモデル [#ec2ecfd5] -パラメータ推定時に確率微分に変換→無理やりオプショングラフに変換? --既にLotka–Volterra遅延微分でパラメータ推定法が確立しているので,わざわざ 優劣の分からない方法を適用する価値あるか? *** やること [#r281adf7] *** (1)[#g529dd02] -Lotka–Volterra遅延微分に本当にノード乗り換えが見えないのか検証→原著読む *** オプショングラフ3種のキャッシュフローはトピック遷移では何になるのか? [#a78b433a] -期間中アクティビティから出る利潤フロー=トピック浮上時の関連ツイート数の流入 -満期終端ペイオフ=ツイートに終わりはないのでなし -アクティビティ乗り換え時の推移コスト=別トピックに移るためのコスト≒流行に乗っかるのは無意識に近いので0? *** (2)アクティビティの価値導出 [#a4f05358] -1次元Wienerの増分:多次元に応用可能とあるが何の近似を使うか不明→四項過程など? -任意時刻の各ノードの価値を終端ノードから順番に計算 --そのときのトピックの人気度が見える? -各時刻でどのキーワードとキーワードがつながっているかのグラフ構造が必要(各ノードには関連ツイート数orインプレッション数の情報あり) --そのようなデータの存在可否は? オプショングラフの当てはめがうまくいかないなら,別方法を検討 *** (3)[#n3f41665] -LDA時系列を改善するほうがノード乗り換えに近いかも --LDA時系列の論文を読む ** どう置き換えていく? [#i247644e] ** データセットは? [#q594c2ce] ** [#c5ee6c9e]
テキスト整形のルールを表示する