#author("2019-12-20T02:44:46+00:00","","") #author("2019-12-20T02:55:09+00:00","","") [[FrontPage]] **司会)山元・書記)沼田 [#a9e56268] ***開始)10:00・終了) [#fb67f52a] ***欠席)渡辺・遅刻) [#i866ff6f] ***議事録 [#qa84c3b3] //###########ここから#############// 麻生さんの発表 -(小野田)6pで複数のインジケータでも使えるのか --為替の一次元で使ってるから大丈夫。多次元の場合工夫必要 -(横井)4pで時間軸でスケーリングとは1分を1時間にということ? --ケーシェイプでは、使う人の自由 -(清水)5p距離尺度の違い --ユークリッドは一点に対して、一方ではデータ(波形)に対して - (平松)クラスAとクラスBが違うデータより同じやつのほうが? --それぞれのクラスタの形を現している - (江崎)7p永遠にループすることはあるのか --永遠にループすることはない - (大谷)クラスタリングするとき、重心どっち --どっちに割り当ててもいいと思う -(沼田)波形に形状がない場合、形状ベースではないほうがいいのか? --特徴がない場合、特徴ベースでもクラスタリングはうまくいかない - (山元)時系列データのクラスタリングで、形状ベースを使っている理由? --特徴ベースだと圧縮されてしまうから。 - (奥原)大丈夫 -- -- 小野田さんの発表 -(横井)10pで損失関数を使わない結果はどのように変化しているのか? --それ以外のパターンは試していなかった。 -(山元)従来手法で使っていない言葉が5パーセント? --わかりづらいが、ニューラルネットのモデルが生成した 増えているから選ばれる確立は上がる -(清水)やんどるソフトマックスとはどんなもの? --通常では、確立で分布させていくもの、ヤンデルソフトマックスでは擬似的に離散的にサンプリングする手法、微分可能になる。 - (平松)実験結果でどんな割合でいい結果が返るか --書かれていない - (沼田)検証とはどういう作業をしているのか --結果がよくなっているか比較するために使っている - (江崎)bの値はどうなっていったのか --bは集合で、回数が出るようになっていてminで1になる。 - (麻生)優位さが出たとはどうやって出したのか --特に書いていない - (大谷)ニューラルネットについて、130万件のデータのうちで検証データが多いほうが結果がうまくいくんじゃないのか --普通は8:2がふつう. - (奥原)(どこかへ) -- -- 横井さんの発表 -(小野田)17pでhdfsじゃなくてhddでも動くか --動く -(江崎)19pで再実行されるとは --一度実行されると均等になるように振り分ける -(山元)この方法を使うにはデータ量が多くないとだめ? --そうです -(清水)円周率以外の例は? --ワードカウントうや数毒 - (平松)hadoopを使う企業はあるのか --yahooとか - (沼田)readよりwiteに時間がかかる理由は --writeするとあるノードに対してコピーをするとほか全部コピーしないといけないから - (麻生)複数の安価なハードでできるが、どれくらいのハード数があればいいか --まだ不明、大規模で使う前提 - (大谷)最後の図でそれぞれ違う乱数なのか --そう - (奥原)hadoopのほうが難しい? --mpithは明確に書かないといけない。 -- 江崎さんの発表 -(小野田) -- -(横井) -- -(山元) -- -(清水) -- - (平松) -- - (沼田) -- - (麻生) -- - (大谷) -- - (奥原) -- -- 清水さんの発表 -(小野田) -- -(横井) -- -(山元) -- -(江崎) -- - (平松) -- - (沼田) -- - (麻生) -- - (大谷) -- - (奥原) -- -- 平松さんの発表 -(小野田) -- -(横井) -- -(山元) -- -(清水) -- - (江崎) -- - (沼田) -- - (麻生) -- - (大谷) -- - (奥原) -- --