「コード」と「区分」と「フラグ」の違い:フラグは”立てるもの”=イチゼロだ!|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

あなたはコードと区分とフラグの違いについて言えますか?

コードと区分とフラグについて、明確に応えられる人が少ないと思います。中途半端の知識の知識でデータを触ってしまうと、本来の項目名と反するデータを登録して、データを煩雑にしてしまいます。そうならないようにデータに携わる全ての人が、コード、区分、フラグの違いについて、共通の認識を持っておくべきです。

すばり!コードと区分とフラグの違い

コードと区分に明確な違いはありませんが、フラグだけは、用途が全く異なります。code_kubun_flg

「フラグ」とは

フラグは、登録できる文字数が1文字と決まっています。また、情報としてのデータも”1”だけと決まっています。ほかのデータが登録されていても何の意味も持ちません。
フラグは、項目名だけで意味を持ち、“1”が登録されていたらその項目名の条件に一致することを意味します。例えば、商品データの中の購入フラグの場合、”1″が登録されていたら、その商品を購入したことを意味します。フラグ項目に”1″以外のデータを登録し、「”1”の場合は購入、”2″の場合は購入予定」などと複数の意味を持たせているデータがありますが、これは、本来の用途と異なる用途のため、混乱の原因になります。

「区分」とは

フラグが1つの意味しか持たせなかったのに対し、区分は、複数のデータを登録することで複数の意味を持たせることができます。例えば、商品データ中の購入区分の場合、「”00″が未購入、”01″が購入済、”02″が予約済」などと登録します。これらの区分と区分の意味(名称)を紐づけた情報が、後々、誰が見ても区分の意味が分かるように情報を分けて保存します。これがマスタデータとなり、購入区分の場合、購入区分マスタとなります。
登録できるデータは様々ですが、下記の条件のデータに統一した方が、混乱は少ないと思います。

  • 数値でななく文字を使う
  • 文字数を統一
  • 半角数字と半角大文字アルファベットで構成

「コード」とは

コードは、基本的に区分と用途の違いはありません。一般的に長い文字列がコードと呼ばれることが多いようです。また、コードは桁数ごとに意味を持つ場合があります。例えば、顧客コードの「2012121201230012」の場合、「20121212」を入会年月日、「0123」を入会店舗、「0012」を入会番号とした場合、2012年12月12日に「0123」店舗で12番目に入会したという情報を持っている場合があります。また、長いコードの場合、扱いやすいように「20121212-0123-0012」などのように区切り文字としてハイフンなどを入れる場合があります。
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

項目名は重要

コード、区分、フラグに限ったことではありませんが、項目名は重要です。項目名は、データの内容が判断できるようにする必要があります。また、1つの項目に複数の属性のデータを登録してはいけません。例えば、購入区分の場合、「”00″が未購入、”01″が購入済、”02″が予約済、”90″が1年サポート、”91″が3年サポート」などと購入情報とサポート情報を2つの異なる属性を入れた場合、混乱の原因になります。この場合、新たにサポート区分などを設け、分けて登録する対処が必要です。
データ分析用語:索引

SERVICE