本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
はじめてのデータ分析。抑えておきたい過去記事
2016年、あけましておめでとうございます。本年もデータ分析で使える情報を発信していきますので、本年もよろしくお願い申し上げます。
今回は、年末年始の長期休暇を利用して、抑えておきたいデータ分析の基礎知識をまとめた過去記事をご紹介します。既にデータ分析を携わっている方も復習として使える記事だと思いますので、お時間があるときに読んでいただければと思います。
データ分析用語
データ分析を行う際によく使われるデータ分析用語、テクノロジー用語をまとめた記事です。普段、使っている言葉でも「説明してくれ」と言われたときに困るような用語もあると思います。これらの「あいまいなデータ分析用語」をできる限り分かりやすく、データ分析者の視点から説明しています。
データ分析用語
- POSデータとは? :何が、いつ、どれだけ、いくらで売れたのかが分かる
- POSデータ分析とは? :「何が売れたか」こそが”己”を知るための最重要手段
- JANコードとPLUコードの違いとは? :実は”レベル感”が違う言葉です
- SKUとは? :「管理したい」最小の単位
- BI(Business Intelligence)とは? :”意思決定”に価値を出すべし
- BIツールとは? :あなたの導入したBIツールは「インテリジェンス」を生み出せていますか?
- リフト値とは?:その事象が、どれだけ「持ち上がっているか」を考える指標
- 「コード」と「区分」と「フラグ」の違い:フラグは”立てるもの”=イチゼロだ!
- データの粒度とは? :データの細かさを示す指標
データ分析で使用するテクノロジー用語
- データベースとは? :一定の規則で整理された情報のカタマリ
- データウェアハウス(DWH)とは? :データを”蓄積しておく”というDBの「使い方」
- データマート(DM)とは? :使いたい情報を見つけやすく整理してある”情報の市場”
- データが「一意となる」とは? :そのデータが”ユニーク”だと言い切るための「キー」があること
- マスタデータ、トランザクションデータとは?
- クラウドとは?:インターネットを介して”なんだかよくわからない”ままサービスが使える
- Nullとは?:何も入っていない状態=「からっぽ」
- 分析データのデフォルト値とは? :何も設定していない時の値
- ETLとは? :あらゆるデータファイルを理解してデータベース化する
- 文字コードとは?:UTF-8はパソコンの世界共通語
- 構造化データと非構造化データとデータの規則性
- 固定長データファイルとは? :桁数でデータ項目を判断する
- データ分析のスナップショットとは? :ある時点の状態を保存する
データ分析のお作法
データ分析のお作法シリーズは、もっとも連載が多い記事です。特にデータ分析のデータの持ち方、考え方に特化した内容になってます。実践から得た生きた情報ですので、はじめてデータ分析を始められる方だけでなく、データ分析のプロでも気づかされる内容は多いと思います。
データ分析の基本
- テーブル命名規約と項目命名規約をつくる
- コード値は”0″もスペースも意味がある!Excelでデータ編集を行う場合は注意が必要
- 売上ベースか?会員ベースか? ~データの親子関係を明確にする~
- データ分析は”当たり前の分析”から始めることが重要
分析データ構造
- 分析しやすい「データ構造」
- 分析しやすい「出力内容」
- 分析しやすい「ファイル形式」
- コード名称変換することによってBIツール、Excelでデータ分析を行いやすくする
- 非構造化データは構造化データに変換して分析する ~人の頭は”表”でしか考えられない~
- 状況遷移をグラフ表示する場合は”ない”ことを表現することが大事
分析カテゴリの考え方
- 1日は24時間ではない!? 分析には分析用の日時を持たせる
- 日付に曜日以外のカテゴリを付ける
- 生年月日から年齢を計算する ~年齢算出の基準日は1つではない~
- 分析フラグを作ることで分析者の認識を統一する
データ分析の作業の効率化
データ分析のミス防止
データ提供時のマナー
- Lesson1:お品書きを付ける
- Lesson2:データファイルのレイアウトは変えない
- Lesson3:機密情報/個人情報を渡す場合のお約束
- Lesson4:データファイルのサイズと形式と転送方法に注意する
データ受領時の”おもてなし”
- Lesson1:受け渡し先を用意する
- Lesson2:保管場所を用意する
- Lesson3:様々なデータ形式を受け入れる
- Lesson4:データ作成をサポートする
- Lesson5:受領データの確認を行う
Excelによるデータ分析
データ分析では、Excelを使用して分析する場面があります。しかし、使い方を誤ってしまうと集計結果が異なってしまうケースがあります。クロス集計で失敗やすい事例からクロス集計の落とし穴を把握しましょう。