マスタデータ、トランザクションデータとは|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

マスタデータとトランザクションデータを理解して、正しくデータを管理する

データを扱う上で必ずと言っていいほど、登場するマスタデータとトランザクションデータについて、解説します。

マスタデータとトランザクションデータ

マスタデータとトランザクションデータについて、IT用語辞典を引用します。

【マスタデータ】 出所:IT用語辞典
企業内データベースなどで、業務を遂行する際の基礎情報となるデータのこと。また、それらを集約したファイルやデータベースのテーブルなど。単に「マスタ」と省略するのが一般的である。
【トランザクションデータ】 出所:IT用語辞典
企業の情報システムなどが扱うデータの種類の一つで、業務に伴って発生した出来事の詳細を記録したデータのこと。“transaction”とは「(商)取引」の意味で、顧客との間の商品の受発注や支払い、納品などを記録したものをトランザクションデータということが多い。その場合、いつ、誰に、何を、何個売り、代金はいくらで、いつ納品で、いつ支払いか、などの情報を時系列に記録する。また、これに加え、購買や生産、社員への給与の支払い、経費の精算などに関する出来事の記録を含める場合もある。

2つのデータの特徴として、マスタデータは固定的なデータ、トランザクションは流動的なデータとして、認識されていることが多く、マスタデータの代表として企業マスタや店舗マスタ、トランザクションとしてPOSデータや仕入データなどがあります。

基礎情報となるデータとは

マスタデータを固定的なデータとしてとらえていた場合、日々、追加、更新される顧客データは、どうなるでしょうか?一般的に「顧客マスタ」と言われるからマスタデータ?毎日変わるからトランザクションデータ?
ここで重要になってくるのは、「マスタデータは基礎情報となるデータ」という事です。マスタデータの基礎情報とは、キー情報に対して、必ず一意の情報が取得できる情報を指します。例えば、顧客コード「00001」に対して、1つの氏名などの顧客情報が取得できる状態を意味します。マスタデータは、常に最新の状態に保つ必要があり、トランザクションデータのように履歴追加せず、追加、削除、更新を行います。このマスタデータのメンテナンス処理をマスタ更新と言います。

マスタデータとトランザクションデータを分ける意味

データ量の削減

トランザクションデータにマスタデータを付加していれば、複数のデータを参照する必要がないため、使い勝手がよくなります。しかし、業務が発生するとトランザクションデータも作られます。これらのデータは、日々の発生量が少なくとも、数年の業務データでは、膨大な量になります。膨大な量の処理には、大容量保存領域と高速なパソコンが必要になり、コストがかかります。このような事態が発生しないよう、トランザクション中の顧客コードに紐付く重複した顧客情報などを顧客マスタなどに待避することで、データの増徴を抑える必要があります。

更新の利便性

トランザクションデータのマスタデータを含んでいた場合、マスタデータの更新が大掛かりなことになります。例えば、顧客コードを持っている馴染みの顧客が、住所変更を行った場合、過去の全ての売上トランザクションデータを更新する必要があり、大変な処理になります。また、売上トランザクションデータ以外のトランザクションにも顧客情報が残っている場合もあります。そもそもトランザクションデータは、蓄積されるデータであるため、データ更新を行うのは、運用上正しくありません。
データは、流動的か動的か、基礎情報となるかによって分割して、データ登録することが望ましいと言えます。
データ分析用語:索引

SERVICE