本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
データウェアハウス(DWH)とは「データベースの用途の名前」です。
本日は「データウェアハウス(DWH)」という言葉を解説します。
DWHはデータベースの用途の名前です。どんな用途でしょうか?
その用途は「データの倉庫」
コンピュータ上に設けられたデータベースは、コンピュータの処理速度の制約によりどうしても過去のデータ(例:14ヶ月以前)を削除せざるをえないという「使われ方」を長い間されてきました。またコンピュータの性能が向上した今日においてもハードディスク容量の制限は依然として存在しており、IT社会の発達とともに激増するデータ量が一つのデータベースには収まらないという事実はかわらないままです。この為、一般的な利用用途のDBは「現在(例:今この瞬間から13ヶ月以内)のデータを格納・管理する」という正確を色濃く持ち合わせてきました。
ここで昨今、
- 過去から現在において、累々と蓄積されてきたデータには、それそのものに価値がある。
- データを削除してしまうのはもったいない。
- でも、現在のデータを格納しているデータベースには負担をかけられない。
という事象が起こってきて、それに対する解法として、
- データを消すことを考慮しなくてよい(本当は遠い未来に消しますが、ここは便宜的にw)
- 大量のデータへの問い合わせを高速で応答する
という用途のデータベースが必要とされたのです。これは現実世界でいうところの「倉庫」としての性格が強いためこのような用途のデータベースに「データウェアハウス(DWH)」という名前が与えられるようになりました。
企業内で運用されるデータベースの構成を例の挙げると、
- 現在の状態を格納・管理するデータベースを基幹系データベースと呼び、
- 過去の状態を格納。管理するデータベースをデータウェアハウスと呼ぶ
ことがあります。データウェアハウスを業務的な用途の視点から「分析系データベース」と呼ぶ企業もあります。
【参考】データマート(DM)とは?:使いたい情報を見つけやすく整理してある”情報の市場”|データ分析用語を解説
データ分析用語:索引