本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
データ分析の虎の巻「データ分析のお作法」
連載記事「データ分析のお作法」は、データ分析でポイントとなる事項を纏めた記事です。これからデータ分析を始められる方だけでなく、今までデータ分析に携わってきた方にも有効な情報を記載しています。
データ分析の基本
- テーブル命名規約と項目命名規約をつくる
- コード値は”0″もスペースも意味がある!Excelでデータ編集を行う場合は注意が必要
- データ同士のリレーション(関係)を意識する
- 売上ベースか?会員ベースか? ~データの親子関係を明確にする~
- データ分析は”当たり前の分析”から始めることが重要
- データ分析が正しいことを証明するための”間違い”の報告
- 桁落ちとオーバーフローとその対処方法
- データベースを使ったデータ分析はNull(ヌル)に気を付ける
分析データ構造
- 分析しやすい「データ構造」
- 分析しやすい「出力内容」
- 分析しやすい「ファイル形式」
- コード名称変換することによってBIツール、Excelでデータ分析を行いやすくする
- 非構造化データは構造化データに変換して分析する ~人の頭は”表”でしか考えられない~
- 状況遷移をグラフ表示する場合は”ない”ことを表現することが大事
分析カテゴリの考え方
- 1日は24時間ではない!? 分析には分析用の日時を持たせる
- 日付に曜日以外のカテゴリを付ける
- 生年月日から年齢を計算する ~年齢算出の基準日は1つではない~
- 分析フラグを作ることで分析者の認識を統一する
- データ分析のレンジによって数値情報をカテゴリに変換する
データ分析の作業の効率化
データ分析のミス防止
- ミスらないデータベースの処理方法
- チェックリストの重要性 ~昔から変わらない確認方法~
- 分析結果チェック ~データ結合後の件数から結合ミスを推測する~
- 分析結果チェック ~集計結果を比較して異常データを探す~
- 分析結果チェック ~チェックポイントは”しきい値前後”と”集計結果の最大値・最小値”~
データ提供時のマナー
- Lesson1:お品書きを付ける
- Lesson2:データファイルのレイアウトは変えない
- Lesson3:機密情報/個人情報を渡す場合のお約束
- Lesson4:データファイルのサイズと形式と転送方法に注意する