データウェアハウス(DWH)とは?:データを”蓄積しておく”というDBの「使い方」|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

データウェアハウス(DWH)とは「データベースの用途の名前」です。

本日は「データウェアハウス(DWH)」という言葉を解説します。
DWHはデータベースの用途の名前です。どんな用途でしょうか?

その用途は「データの倉庫」

コンピュータ上に設けられたデータベースは、コンピュータの処理速度の制約によりどうしても過去のデータ(例:14ヶ月以前)を削除せざるをえないという「使われ方」を長い間されてきました。またコンピュータの性能が向上した今日においてもハードディスク容量の制限は依然として存在しており、IT社会の発達とともに激増するデータ量が一つのデータベースには収まらないという事実はかわらないままです。この為、一般的な利用用途のDBは「現在(例:今この瞬間から13ヶ月以内)のデータを格納・管理する」という正確を色濃く持ち合わせてきました。
ここで昨今、

  • 過去から現在において、累々と蓄積されてきたデータには、それそのものに価値がある。
  • データを削除してしまうのはもったいない。
  • でも、現在のデータを格納しているデータベースには負担をかけられない。

という事象が起こってきて、それに対する解法として、

  • データを消すことを考慮しなくてよい(本当は遠い未来に消しますが、ここは便宜的にw)
  • 大量のデータへの問い合わせを高速で応答する

という用途のデータベースが必要とされたのです。これは現実世界でいうところの「倉庫」としての性格が強いためこのような用途のデータベースに「データウェアハウス(DWH)」という名前が与えられるようになりました。
企業内で運用されるデータベースの構成を例の挙げると、

  • 現在の状態を格納・管理するデータベースを基幹系データベースと呼び、
  • 過去の状態を格納。管理するデータベースをデータウェアハウスと呼ぶ

ことがあります。データウェアハウスを業務的な用途の視点から「分析系データベース」と呼ぶ企業もあります。
【参考】データマート(DM)とは?:使いたい情報を見つけやすく整理してある”情報の市場”|データ分析用語を解説
データ分析用語:索引

SERVICE