データウェアハウス(DWH)という言葉を聞いたことがありますでしょうか。
日常生活ではあまり耳にする用語ではないため、知らないという方も多いかもしれません。
そこでこの記事では、DWHとは何か、なんのために使うのか、そして実際のDWH活用方法などの基本的な知識を解説していきます。
DWHとは何?
DWH(Data Warehouse)とは、そのまま訳すと「データの保管所」となります。
といってもあまりピンとこないと思います。
一番有名な具体例をあげると「コンビニのレジのPOSシステム」です。
数ある店舗の売上高や、商品構成、支払い方法などの顧客データを本部で管理して時系列に整理できる、データ分析には欠かせないシステムとなっています。
DWHは蓄積された大量のデータを分析することによって、経営方針やマーケティングにおいての、重要な意思決定をするための資料として使用されています。
特にみなさんご存知の「Tポイント」は、自社のチェーンのみならず、色々なチェーン店に加盟してもらうことにより、食品や雑貨という業種を超えたデーターを蓄積することに成功しました。
ではDWHは「データベース」「データマート」と何が違うのでしょうか。
よく混同されて使われているため、違いをわかりやすく解説します。
DWHとデータベースの違い
データを格納する場所といえば「データベース」が有名です。
DWHも、データベースの一種ではありますが特徴が大きく違います。
データベースとは「決まった形式でまとまったデータのかたまり」のことを指しています。
例えば、様々な場所から顧客のデータを集めて出力した場合、データベースの場合は「項目」がバラバラになってしまっているケースがあります。
わかりやすい例では「ふりがな」がひらがなとカタカナが混在してしまっているケースです。
データベースは分析を目的としたものではなく、あくまでもデータの記録・参照に利用されるというものです。
DWHは、データ保存の形態が統一されているので、複数のシステムから集まったデータを分析することが可能になります。
DWHとデータマートの違い
では「データマート(Data Mart)」との違いはなんでしょうか。
データマートもデータを格納するためのシステムの一種ですが、DWHがデータ全体を意味するのに対して、マートはデータの中の小規模な一部のことを意味します。
データマートは、DWHの中からマーケティング・営業・顧客管理など、それぞれの部門に必要な情報だけを取り出したもので、データ分析のために実務で使用するのが目的ということになります。
そのため、売上やユーザー属性など、特定目的のデータ分析のみに使用され、企業の経営判断などの意思決定には向いておりません。
なぜDWHが注目されるのか?
DWHが注目されているのは、複数システムのデータを組み合わせて統合することで、まとまったデータ管理をする必要があったからです。
今までのデータベースなどはそれぞれが独自のフォーマットで管理されていたので、組み合わせることも照合することもできませんでした。
そこで、データの統合的な分析ができるDWHに注目が集まったというわけです。
DWHは大きく分けて「クラウド型」と「オンプレミス型」の2つに分類できます。
オンプレミスはオフラインでも使用できるため、セキュリティ面では安心ですが、
最近はもっぱらクラウドタイプが主流になっています。
では、クラウドのDWHにはどのようなメリットがあるのでしょうか。
クラウドDWHのメリット
クラウドDWHは、データ保管場所がオンライン上のため、機械を購入したり、設置の場所を考えたり、維持費などもかからないため、コストを大幅に抑えることができるのが大きなメリットです。
ネットワーク障害が心配なところではありますが、最近はシステムを分散することでリスクヘッジができたり、トラブル対応もクラウド会社が行ってくれます。
DWHの4つの機能
1. 時系列データ
DWHで保管されるデータは時系列に並べることができます。
例えば、銀行口座の出金や入金、振込など、全てのデータを時系列順に記録することで現在の状態とお金の出入りの流れを把握することができるようになります。 |
2. サブジェクト分類
DWHはサブジェクト(テーマ)ごとにデータを分類することができます。
例えば、コンビニで電子マネー等を使った売上があった場合、日付や金額・商品の属性、顧客の情報など、複数の種類の情報があります。 |
DWHはサブジェクト分類をしてデータ保管することができます。
顧客情報のサブジェクトの中に「氏名」「住所」「メールアドレス」などの顧客に関連する情報だけが集約されます。
このようにデータをジャンルごとに管理することで、他のシステムとのデータ重複を防ぐことができます。
3. データの統合
DWHの機能の3つ目は、複数のシステムにおけるバラバラのフォーマットデータを、統一した状態で保管できることです。
例えば、顧客住所が「東京都」から始まっているか、「〇〇区」から始まっているかといった異なるフォーマットを変換して、統一フォーマットで保存することができるようになります。 |
エクセルでデータを扱っている時に、項目によって全角や半角の違いがあったり、住所が「〇丁目〇番地」なのか「〇-〇」なのかで探せない、といった経験をしたことがある人も多いでしょう。
DWHはそういった「ずれ」をシステムによって解決してくれるのです。
4. 長期保管
4つ目の特徴は、データの長期保管です。
過去のデータが上書きされずに追加されていくので、顧客のLTVを醸成するための長期的な分析ができます。
DWH(データウェアハウス)はどう活用する?
DWHは主に2つの活用例があります。
顧客管理におけるデータ活用
顧客の個人情報や購買履歴などのデータを時系列で保管することで、顧客がどのように購買行動をとったか、また購買するための傾向分析などを行うことで、カスタマーサポートの対応方針を決めるなど、効果的な反映が可能です。
経営方針の分析に活用
データ分析を得意とするBIツールを連携することで、経営判断にも役立つための高度なデータ分析が可能になります。
DWHとデータ連携をして分析することで、より高度な経営判断や意思決定を行うことができます。
まとめ
いかがでしたでしょうか?
DWHに各データベースのデータを集約することによって、顧客情報を可視化することができ、現場でも経営層でも同じように今後のビジネスの判断材料として使用することができるようになります。
ただ、DWHを導入するにはそれなりのコストが必要になり、またDWHそのものの知識も必要となりますので、導入する前に、まず「DWHのデータを用いて何をしたいか」を明確にするところからスタートしましょう。
ビジネスの目的とDWHがマッチしていれば、大変高い費用対効果を発揮するのは間違いありません。
経営者・現場ときちんと調整をした上での導入検討をされることをお勧めします。