状況遷移をグラフ表示する場合は”ない”ことを表現することが大事 | データ分析のお作法
f t p h l
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
目次
折れ線グラフは細部まで見ない。”ない”ことを表現して誤解の無いグラフを作成する
折れ線グラフなどによって売上の状況推移を表現することは多いと思います。スーパーやコンビニなどの小売業の場合は、常に売れる商品が大半を占めているため問題はありませんが、車やバイクのディーラ店などでは、扱っている商品が常に売れるとは限りません。今回は、車のディーラー店の月の売上推移を例に「”ない”ことを表現する」とはどういうことかを説明したいと思います。
”月の売上が無い商品”は表現できない
月々のある車種の売上について、横軸を販売月、縦軸を売上金額にしたとき下記の様な折れ線グラフになります。ここで重要なのは、横軸の販売月は”売上があった月”しか表示されないということです。そのため、下記の例の場合、8月の売上が無かったため、折れ線グラフ上に表示されません。この折れ線グラフをパッと見ただけでは、順調に売上を伸ばしているように見えるため、誤解を与えてしまい良くありません。
”月の売上が無い商品”を表現するには
先ほどは、良くない例を通して、”ない”ことを表現することの重要性についてご理解いただけたと思います。ここからは、下記のように8月の売上金額が0円として表示する方法について説明します。
この折れ線グラフは、「月々のある車種の売上」について表現したものです。そのため、下記のように折れ線グラフに表現する”車種”と”販売月”を折れ線グラフの対象データに行として追加すれば良いのです。これによって、全ての車種、販売月で売上金額を折れ線グラフを表現することができます。
集計する単位を考慮して、全ての集計キーの情報を保管する
今回は、車のディーラーを例に全ての車種、販売月の売上金額を行として追加しました。このように集計キーの全量を行として持つようにします。集計キーは、折れ線グラフの横軸に該当する項目です。また、DBの売上情報が入っているテーブルからグラフを直接している場合、一度、集計結果を中間テーブルに保存して、”ない”行のデータ補完してからグラフ表示するなどの処理が必要になります。
連載/関連記事リスト:データ分析のお作法
f t p h l