「今年の夏は暑い」は本当か?(1):身近なネタで考えるグラフの使い方|冷やしデータ分析はじめました
- TAG : Tech & Science | グラフの使い方 | データアーティスト | 冷やしデータ分析はじめました
- POSTED : 2015.07.30 08:55
f t p h l
夏といえば、やっぱりデータ分析だよね!
暑い日が続きますね。こんな日はアイスクリーム片手に「データ分析」するに限りますね。ということで、この連載では、「猛暑を乗り切る楽しいデータ分析」をテーマに、いろんな分析に取り組んでみたいと思います。
「今年の夏は、暑いよねー」という決まり文句は正しいのか?
毎年毎年、夏になると「今年の夏は暑いなー」という言葉を耳にします。僕は38年生きてきましたが、物心ついたころから、ほぼ毎年耳にしてきました。ほんまにあついんか?おまえ、そのセリフ言いたいだけちゃうんか?と突っ込みたくなりながら、突っ込まずにやり過ごしてきましたが、今年こそは、ちゃんと検証してみたいと思います。
使用するデータは、気象庁が公開している「過去の気象データ」です。
このデータの中で「東京」の「月ごと」のデータを取得して、月単位で年推移をグラフ化しました。1876年1月から2015年7月(途中までのデータですが)をプロットしています。
検証①:夏は暑い?
赤実線が8月、黄色が7月、緑が9月です。(赤点線が、年平均です。)当たり前ですが、殆どすべての年で、8月が一番気温が高くて、次が7月、次が9月、です。やはり「夏は暑い」のは間違いないですね。
検証②:年々、暑くなっている?
9月が30日しかないだろ、という話はさておいて、単純に7,8,9月の気温を平均してグラフ化すると、このようになります。
こう見ると、何となく、年平均も、7-9月平均も同じように右肩上がりになってきてるように見えます。
検証③:暑い夏=暑い1年なのか?
こんな風に「動きが似てるかも?」と思った時は、とりあえず散布図です。横軸が「年平均」で縦軸が「7-9月平均」です。右に行くほど年平均気温が高く、上に行くほど7-9月の平均気温が高い、ということですね。
R2(アールスクウェア)0.6 なんとなく相関性がありそうなんですかね・・・と思ったあなたは夏の暑さにヤラれてます。
気温が高い3ヶ月を入れた「年平均」は偏ってる
年平均と、7-9月平均を比較しても無駄です。7-9月が毎年一番気温が高いわけですから、それを含んだ年平均は「引き上げられて」います。この暑い季節のデータを除いた1-6月+10-12月の平均データと比較しましょう。
まずは、折れ線グラフ。
右肩上がりの傾向は変わりませんが、散布図で見てみるとどうでしょう?縦軸は「7-9月平均」で変わりませんが、横軸が「7-9月以外(=1-6月+10-12月)平均」です。
R2が、0.4までさがりました。
この時点で言えるのは、「夏の暑さが厳しい」ということと「年間通して気温が高い」ということは、直接的な関係がなさそう、ということです。
⇒ 次回へ続きます
f t p h l