由利恵?

目次 

 

プログラム 

#ref(): File not found: "open-data.zip" at page "長瀬さん"

データ収集 

 

e-stat

n1.png
 

絞り込みで「区」を外し、地域候補は「全て選択」をクリックし確定

 
n2.png
 

項目候補の中から欲しいデータを選択し「項目を選択」をクリックし確定
(今回は一番上の「婚姻件数」を選択してみる)

 
n3.png
 

右上の方にある「ダウンロード」をクリック

 
n4.png
 

「ダウンロード」を押すとcsvファイルが保存される

 
n5.png
 

データ整理 

 

data-city_num.csvには全ての地域コードが含まれているわけではないため、ダウンロードしてきたFEI_CITY_240305145146.csvの地域コードと合わせる必要がある

新しいExcelファイルを立ち上げ、VLOOKUP関数を使用し抜き出した

ダウンロードしたデータすべてに同じことをする

open-data_2020.csvファイルをコピーし、コピーしたファイルの1行目を変更する(open-data_2020copy.csv

open-data_2020copy.csvの1行目を画像のようにx_1からx_○と書き換える(x_1とかの書き方じゃなくてもいい)

コピーする理由は1行目を変更してしまうと、どのデータが入っていたかが分からなくなるから

 
n8.png
 

データのグループ分け 

 

中島さん

の中にある

を参考にしながら行う

 

データの変換 

 

データのグループ分けで作成したファイル(今回はopen-data_2020_LPA_result_okuhara.csv)のC列からF列をコピーし、

open-data_2020_okuhara.csvのN列からQ列に貼り付ける

 
n9.png
 

open-data_2020_okuhara.csvのExcelをコピーして、コピーしたものを使用していく
open-data_2020_okuhara.csv

A列からQ列をコピーしS列以降に貼り付け、以下の処理を行っていく

と分けられる

 
n10.png

説明的変数は列の一番大きい数字で割る

目的変数はZ-Scoreを行う

  1. 説明的変数
     
    入力されている数値をその列の一番大きい数字で割る

①S1を選択し、数式バーに

=A2/MAX(A$2:A$652)

を入力し下までオートフィル

この時に絶対参照を忘れないようにする

②S1のものをx_12までオートフィルを行い、同様にしたまで行う

#ref(): File not found: "11.png" at page "長瀬さん"

  1. 目的変数
     
    Z-Scoreは(データの値‐平均)/ 標準偏差 で求めることが出来る

今回は「STANDARDIZE関数」を使い計算した

=STANDARDIZE(M2,AVERAGE($M$2:$M$652),STDEV.P($M$2:$M$652))

を入力する

n12.png

実行 

結果 

保存期間5年の修論プログラムからRF6….pyダウンロード

170行目書き換える

175行目

1058行目

プログラムが動いているか確認したければ528行目の500を5に変更し617行目のコメントアウトをコメントアウトじゃなくす その際実行後500に戻すのとコメントアウトにすることを忘れないように

19行目インプットapikey keyの番号を変える

26行目 29行目

量的なデータ 市区町村コードが降られている コードと遂になっているもの探す e-stat

1321


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS