武藤さん卒論_backup
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
開始行:
[[技術資料]]
*環境構築 [#ve406b35]
システム開発に便利なJupyterをインストールする
**anaconda インストール [#f3760e3d]
jupyter上で仮想環境を複数作れるのでanacondaを推奨する
*スクレイピング [#t87399b0]
**このリンクからヒトの遺伝子とパスウェイを取得する [#k82c...
http://rest.kegg.jp/link/pathway/hsa
-hsaは接頭辞で'Homo sapiens'を表す
-他の生物を取ってくる場合,この部分を変えればいい(例:ゴ...
-requestsでurlを,BeautifulSoupでhtml内の文章を取得してい...
*隣接行列作成 [#l98d3c1f]
**遺伝子数×2の二次元配列を作成 [#h2c676e0]
re.subで'path:'を空白に,split()で\n,\tを取り除く
**二次元配列を整理して対応表を作る [#s6abdea3]
遺伝子数が多ければ多いほど2重for文=n×n時間かかるので,性...
** 共起頻度の隣接行列作成 [#u8dfe9df]
-対応表0列目をインデックス・カラムにしたデータフレーム(...
-set()の集合演算(積集合)によって(共通部分=同じパスウェイ...
--普通に配列検索でやると4重ループとなり,数日かかるおそれ...
--集合演算で4重→2重に減らせるが,それでも10時間ほどかかる...
*共起頻度に応じて遺伝子のランキング [#xccda8bb]
終了行:
[[技術資料]]
*環境構築 [#ve406b35]
システム開発に便利なJupyterをインストールする
**anaconda インストール [#f3760e3d]
jupyter上で仮想環境を複数作れるのでanacondaを推奨する
*スクレイピング [#t87399b0]
**このリンクからヒトの遺伝子とパスウェイを取得する [#k82c...
http://rest.kegg.jp/link/pathway/hsa
-hsaは接頭辞で'Homo sapiens'を表す
-他の生物を取ってくる場合,この部分を変えればいい(例:ゴ...
-requestsでurlを,BeautifulSoupでhtml内の文章を取得してい...
*隣接行列作成 [#l98d3c1f]
**遺伝子数×2の二次元配列を作成 [#h2c676e0]
re.subで'path:'を空白に,split()で\n,\tを取り除く
**二次元配列を整理して対応表を作る [#s6abdea3]
遺伝子数が多ければ多いほど2重for文=n×n時間かかるので,性...
** 共起頻度の隣接行列作成 [#u8dfe9df]
-対応表0列目をインデックス・カラムにしたデータフレーム(...
-set()の集合演算(積集合)によって(共通部分=同じパスウェイ...
--普通に配列検索でやると4重ループとなり,数日かかるおそれ...
--集合演算で4重→2重に減らせるが,それでも10時間ほどかかる...
*共起頻度に応じて遺伝子のランキング [#xccda8bb]
ページ名: