本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
政府統計の総合窓口(e-Stat)から情報を取得する
前回、もっとも身近なデータとして、気象庁のホームページから過去の気温や降水量などの気象情報を取得しました。今回は、政府統計情報から市区町村の人口や人口密度などを取得します。
政府統計の総合窓口(e-Stat)とは
「政府統計の総合窓口(e-Stat)」は日本の各府省が公表する統計データを一つにまとめたポータルサイトです。e-Statのページから情報を自由に取得できます。取得できるデータの形式は、CSVファイル、Excelファイル、PDFファイルの3種類です。データ分析を行う場合、データの取得形式は、CSVファイルの方が、取り扱いやすいと思います。
統計頻度にバラつきがある
人口などの統計情報は、5年ごとのデータしかありません。これは、国勢調査の調査結果を元に作成されているため、5年ごとの情報しかありません。そして、今年(2015年)は、国勢調査の年ですので、まだ、調査報告が出ていません。最新の人口情報は、2010年(平成22年)の情報ですので、だいぶ古いことになります。このように各府省の統計頻度によって、統計頻度が異なります。
統計のタイミングにバラつきがある
例えば、2010年(平成22年)の人口、人口密度の統計タイミングは、国勢調査が行われた2010年10月1日零時時点です。2010年の1世帯当たりの貯蓄額などの統計タイミングは、国民生活調査が行われた2010年7月です。このように各府省の調査タイミングによって、統計タイミングが異なります。統計であるため、数か月の調査タイミングのズレがありますが、調査の母数が大きいためデータの不一致は発生しません。しかし、震災やなどの大きな出来事が発生した場合は、数か月でもデータの不一致が発生する恐れがありますので、注意が必要です。
日本人口をデータ分析する
では、実際にe-Statから人口情報を取得します。e-Statのトップページから、統計データを探すの「主要な統計から探す」、人口・世帯の「国勢調査」、提供統計名の「平成22年国勢調査」、人口等基本集計「全国結果」の順にリンクをたどります。下記のダウンロード一覧が表示されましたら、「1.人口,人口増減~」のCSVボタンをクリックします。
ダウンロードしたファイルをExcelで開くと、下記のような統計が表示されます。人口などの情報は、全国、都道府県、都道府県地区、市町村などの単位で集計されています。集計のカテゴリは「地域識別コード」列で絞り込みできます。例えば、地域識別コードが「a」の行だけを絞り込んだ場合、下記のように都道府県の集計のみが表示されます。
政府統計情報は調査方針を理解して組み合わせる
政府統計情報は、各府省の調査方針によって、頻度、タイミング、範囲など異なります。同じ国勢調査などの調査方法内のデータを組み合わせる場合は問題ありませんが、別の調査方法との組み合わせの場合は、注意が必要です。