レシートからトランザクションテーブルを想像する|レシートから考えるPOSデータ分析(4)

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

レシートの項目からテーブルを作成する

前回の記事「レシートの項目を”階層”ごとに分類する」では、レシートの項目は以下の3つに分類できるということを書きました。

  1. 店舗ごとの情報
  2. レシートごとの情報
  3. 購入商品ごとの情報

このうちのもっとも細かい分類は、3.の購入商品ごとの情報です。1つの店舗に対して数多くのレシートが存在しますし、また1枚のレシートには1つ以上の購入商品が記載されているからです。
全部のデータをデータベースにもれなく格納しようとすると、もっとも細かい分類に合わせてデータを整える必要があります。レシートではこれが「購入商品ごとの情報」になります。 この考えに従って、前回の記事に掲載した2つのレシートからデータベースを作成してみましょう。
receipt4-1
購入品目が1列ずつに分けられてテーブルに格納されています。なお、購入品目数が2以上ある場合には、「店舗ごとの情報」・「レシートごとの情報」には同じデータが繰り返し並んでいます。

レシートとトランザクションテーブル

小売店で言うところのトランザクションデータとは、商品の販売履歴を時系列に記録したデータです。

企業の情報システムなどが扱うデータの種類の一つで、業務に伴って発生した出来事の詳細を記録したデータのこと。
“transaction”とは「(商)取引」の意味で、顧客との間の商品の受発注や支払い、納品などを記録したものをトランザクションデータということが多い。その場合、いつ、誰に、何を、何個売り、代金はいくらで、いつ納品で、いつ支払いか、などの情報を時系列に記録する。
出典:トランザクションデータとは | transaction data – 意味/解説/説明/定義 : IT用語辞典

このトランザクションデータを格納したデータベースがトランザクションテーブルです。(詳しくはマスタデータ、トランザクションデータとは)
上で作成したExcelの表は、トランザクションテーブルの一部であると言えます。全く現実的ではありませんが、店で発行された全レシートを入手し、上のようにExcelの表を作成すれば、実際のPOSシステムのトランザクションテーブルに近くなるでしょう。
レシートの情報をまとめて表にしただけですが、POSシステムのトランザクションデータのデータベースを垣間みることができました。しかしながら、上で作成した表は重複した項目が多く、とても見づらいです。
次回は、この見づらい表をよりすっきりさせるため、「データの正規化」について考えてみることにします。

連載/関連記事リスト:POSデータ分析
SERVICE