”何” と ”どう”比べて「暑い」と言っているのか?
ますます暑い日が続きますね。暑さが過ぎると、アイスではなくかき氷が売れるようになるそうですよ。というわけで、前回に引き続き、「今年の夏が本当に暑いのか」をかき氷片手に考えてみたいと思います。
「今年の夏は、暑いよねー」という決まり文句は正しいのか??
前回は、そもそも夏って暑いの? ということと、 夏が暑い年は年間通して気温が高いの?ということを見てみました。前者は証明され、後者は証明されませんでした。(ただ、後者は、1年というサイクルは人間が定めたものですので、1月~12月という枠組みの中での”夏”を見ています。ひょっとすると、7~6月のサイクル、あるいは10~9月のサイクルで見れば、相関するのかもしれません。※未検証ですし、やりませんけど)
今回は、少し切り口を変えてみていきたいと思います。
検証④:前年に比べて暑いのか?
そもそも「今年の夏『は』暑い」というとき、何と比べて暑いのでしょう? ということで、前年と比べてみましょう。
A)年別7-9月平均 前年との「差」
凸凹です。つまり、上がったら下がる、下がったら上がる、ということですねこういうグラフを見たときに、思いつくべきは「ヒストグラム」です。
とはいえ、いきなりヒストグラムを書くと、何が何だか分からなくなることもあるので、全体観から入りましょう。
B)上がった年と下がった年では、どちらが多いの?
まず、138年分のデータを、前年より気温の上がった年(ピンク)・前年と同じ年(グレー)・前年より気温が下がった年(青)の3つに分けます。
見ての通り「上がった年と下がった年は、ほぼ同数」ということになります。つまり「上がったら下がる」「下がったら上がる」わけです。
ここまでわかったら、今度こそ「ヒストグラム」の出番です。
C)前年との気温差(7-9月平均)ヒストグラム
はい。ほとんど、左右対称ですね。つまり、前年と比べると、上がる年もあったし、下がる年もあったね。ということです。「直線的に温度上昇が進んでいる!」ということではなさそうです。
(参考)D)ヒストグラム的に、二山あると気持ち悪い
尚、ヒストグラムがフタコブラクダになると気持ち悪い、という方もいると思います。今回は変化しない(±0)というものを中心に据えているのが原因と思われます。ちょっとエイヤッ感はありますが、±0と、05度以内の上昇・下降をまとめて「±0.5」とすると、こんな感じになります。
あんまり変化しない年が一番多いんだねー、ってなりますよね。まぁ、そんな感じです。
検証⑤:年々、暑くなっているか?(part2)
前回、7-9月平均を使って、年々暑くなってるのか?ということを見てみましたが、ぶっちゃけ、よくわからなかったのではないでしょうか?
再掲:年別 7-9月平均気温の推移
こういう時に使うのが「移動平均」です。
E)年別 7-9月平均気温の推移(移動平均 5年/10年)
青い方が、過去5年間の平均(つまり、1900年なら1896~1900の5年間の平均、2008年なら2004年から2008年の5年間の平均)を示していて、オレンジの方が過去10年間の平均(1900年なら1891~1900、2008年なら2009~2001の平均)を示しています。
当然ながら、毎年の変化よりも、5年移動平均(青)の方が滑らかになりますし、10年移動平均(オレンジ)の方がより滑らかな動きになります。
検証⑥:暑い「日」は多いのか?
続いては、暑い日の「数」を見てみましょう。(※データソースは同じですが、取得方法が異なります。ご注意ください。)
F)最高気温25度以上の日の推移(3区分) ※各年7-9月のデータを使用
まずは、最高気温が25度以上の日数(黄色)です。また、その内訳として25~30度(グレー)、30~35度(オレンジ)、35度以上(青)も併記しています。
上下の振れ幅が大きく、判別しにくいですが、青(35度以上)が増えてきているように見えます。
G)最高気温25度以上の日の推移(3区分):5年移動平均
続いて、先ほども使った”移動平均”でチェックします。まずは5年。
オレンジと青が増加傾向にあるように見えますね。
H)最高気温25度以上の日の推移(3区分):10年移動平均
続いて、10年。
完全に青(35度以上)が増加してます。オレンジ(30-35度)とグレー(25-30度)は真逆の動きをしているようにも見えます。ただ、いずれにしても、1920年ごろで、オレンジの数がグレーを上回ったようです。
I)最高気温25度以上の日の推移(3区分):10年移動平均 (1884年を1.0とした変化率)
こういう時に使うのが「基準点に対する比率でみる」というテクニックです。(ただし、やり方を間違うと「ミスリード」するので注意は必要です。後述します。)
この場合10年移動平均の最初の点である1884年の値を1.0として、その後、それが何倍になっているかを見る、という手法です。説明するまでもなく、35度以上(青)の日数が急増しているということが一目瞭然ですね。(目を凝らしてみれば、30-35度(オレンジ)が微増、ということも分かりそうです)
尚、先ほど、ミスリードするおそれがある、と述べましたが、一番やってはいけないのは「これだけしかみない」ということです。例えば、このグラフ。
僕は、孫さんのプレゼンテーションを直接聞いたわけではないので、ひょっとしたら補足説明があったのかもしれませんが、(リンクした記事の)このグラフをみた瞬間に「絶対量ではどうなの?」と思ってしまいます。(言うまでもないことですが、このグラフは”相対値”です。)調べてないのでよくわからないのですが、仮に、この710倍になった状態でも、製造業の1/3とかにしかならないのだとしたら、この孫さんのグラフは完全に【ミスリード】しています。その場合、間違いなく意図的にやってます。
ということで、比率で見たくなるときにも、兎に角、絶対量で見るところから始めましょう。ええ。ホントに大事ですよ。これ。
参考: J)層グラフで見てみると・・・
「暑い日」の状況をみてきて、35度以上の日が増えていることが分かりました。こういう時に、違う見方も覚えておくと便利です。それが「層グラフ」です。
こんな感じです。3つの要素(25-30度、30-35度、35度以上)を積み上げて表現してくれます。この図の一番上の線(グレーの層の上端のライン)は、「グラフH」の黄色い線と同じ形を描きます。(当たり前ですが、一番下にある青も、グラフHの青線と同じ波形になります)
さらに参考: K)層グラフの順番を変える・・・
ここで、ポイントになるのは表示順です。気温の高低と層の順番を合わせる、などのテクニックがあります。ということで、上下を入れ替えてみました。
グレーが減っている(25-30度が減っている)、オレンジ(30-35度)が増えている、青(35度以上)が増えている。ということが一目で分かると思います。
さらにさらに参考: L)100%層グラフにしてみると・・・
3つを積み上げたモノを「100%」とすると「3つの合算値のブレ」を無視して”構成比”を見ることができます。
1914年ころまでは、25-30度が50%を上回っていたのに、徐々にグレーが減り、オレンジ(30-35度)が勢力を増していることが見て取れます。また、青い層も、1920年ごろから勢力を拡大し始め、1990年あたりから急激に拡大しているように見えます。
やっぱり、夏は暑くなってきている
ということで、「夏場(7-9月)の平均気温」と「夏場(7-9月)の30度以上の日数」というふたつの観点からみて、「夏はだんだん暑くなってきている」ということが言えます。
尚、このグラフに「2015年」を追加すれば、このトレンドに逆行しているのか、そのままトレンド通りに暑くなっているのかを検証することができます。
ということで、冷やしデータ分析を銘打っておきながら、「夏が暑い」という当たり前のことを分析した「お寒い結果」になってしまいましたことを、心よりお詫びします。
次回は(もし、あるならば、ですが)もう少し”涼を感じられる”分析をしてみたいと思います。 →”次回”を公開しました!
<<<<< 宣伝 >>>>>
当記事の著者、田中の著書「数字力×EXCELで最強のビジネスマンになる本(翔泳社)」では、こういった「分析の基本的な考え方」を解説しています。タイトルに偽りアリで、エクセルのお役立ちテクニックがほとんど書かれていない、というご意見も頂戴するのですが、「どういう分析がしたいのか、という部分を押さえておけば、たいていの分析は ”超基本的なエクセルの関数” だけでできますよ、という内容になっています。
実際、当記事の分析も、すべて「エクセルの、めっちゃ基本的な関数だけ」で行っています。大事なのは「考え方」なのです。