データ活用

2021年8月30日

データウェアハウス(DWH)とは? 活用メリットと DB や BI ツールとの違いを紹介

自社で保有するデータの活用が重要視される中、「DWH」「データベース(DB)」「BI ツール」などの言葉を耳にする機会が増えました。これらはいずれも、経営戦略の中でデータを活用した意思決定を行う際に活用されるツールですが、それぞれ別の目的を持ちます。本記事では、これらの違いや DWH のメリットについて解説します。

DWH の定義

「DWH」とは「データウェアハウス(Data Warehouse)」の略称で、日本語では「データの倉庫」を意味します。生産管理・販売管理・会計システムなどの「基幹系システム」や、 CRM、 SFA、 MA といった顧客情報を管理する「情報系システム」で蓄積されるデータを一元化し、時系列ごとに整理するシステムのことです。プラットフォーム上であらゆる情報をまとめて管理するソフトウェアであり、データベースのひとつに数えられます。

DWH の定義には、「サブジェクト指向」「データ統合」「時系列で保存」「データの削除・更新をしない」という、必ず満たすべき 4 つの要件があります。これら 4 つの要件を満たしているものを、一般的に DWH と呼びます。

サブジェクト指向

従来のデータベースではデータを「目的別」に格納されますが、 DWH では「内容」ごとに格納します。これは、本を内容で分類する図書館の資料整理方法に似ており、たとえば DWH では販売実績データを「販売データ」としてまとめて保管せず、「顧客」「商品」「取引」「店舗」「価格」「住所」「色」「サイズ」のようにサブジェクトに分解して保管します。

販売実績と顧客情報のように、別々の目的で収集されたデータであっても、サブジェクト別に保管することで内容の重複を防止できます。

データの統合

DWH は、企業が保有する全業務システムの情報資源を一元管理できます。

通常、データはアプリケーションの種類やファイル形式、カテゴライズ、情報の内容がバラバラで、そのままでは内容の重複が発生し、管理するうえで不都合が生じてしまいます。その点DWH では、名称・分類・表記・単位・表現を論理的に統合するため、データに整合性を持たせ、抽象化した形でサブジェクト別に格納します。

たとえば、クライアントの名称が「顧客」「取引先」「企業」「仕入先」「販売先」「個人」「法人」などと別の表現にならないように、抽象化して 1 つの名称で保管するイメージです。

時系列を持つ

データベースでは現在進行形の情報を取り扱うため、過去のデータは削除されてしまいます。しかし、 DWH は過去のデータを削除せずに格納するため、時系列で整理されます。古いデータが残った状態で蓄積され続けていくため、特定の期間における状態確認や顧客行動の変化などを把握できます。

また、顧客行動を長期的な視点で抽出できることから、統計データの分析やレポーティング、ビックデータのデータマイニングなどさまざまな用途で役立ちます。

データを削除しない

一般的な基幹系システムでは必要なデータだけを保管していればよいため、古い情報は削除・上書き・更新され、長期的な履歴は残りません。一方、 DWHで は新しいデータが追加される際、過去データは削除されず永続的に蓄積され続けます。長期的な保有を行うため、履歴を遡った抽出が行えます。

なお、永続的に蓄積することを前提としていますが、容量に合わせて削除が行われることもあります。その際は、「削除した」という履歴を残しておくことが重要です。

DWH の特徴を活かした活用事例

企業が保有するすべての情報資源を有効活用できれば、顧客行動の変化や現状の課題抽出などはもちろん、適切なタイミングでのコミュニケーションやマーケティング施策を行うことも可能です。以下では、 DWH の特徴を活かした活用事例をご紹介します。

EC サイトによるデータ活用

EC サイトの収益を増加させるためには、行動履歴・購入履歴・購買傾向・顧客情報・コミュニケーション履歴・収益情報など、さまざまなデータをもとにマーケティング施策を講じる必要があります。大規模な EC サイトや大手 EC サイトでは、顧客満足度の向上や収益の最大化のために DWH を導入し、データの管理・分析を行っています。

たとえば、購買履歴から商品の売れ行きを時系列で確認し、売れる時期や条件を分析することで、適切なタイミングでキャンペーンを実施できます。また、顧客の購買履歴や行動履歴をもとに、売れ筋商品の傾向やユーザーのニーズを抽出することで、新たなサービスの開発やプロモーション活動の実施、顧客ごとにパーソナライズされたコミュニケーションなども可能となります。

航空会社の航空券の予約

航空会社でも DWH が導入され、最適な座席在庫管理を実現し、空席率の改善に貢献しています。航空会社では運行管理・スケジュール・収益・座席在庫・予約情報・発券情報・搭乗管理・顧客情報など、多くの業務管理システムが利用されていますが、 DWH を導入することで、これらの情報の横断的な分析が可能になります。

たとえば、過去の乗客履歴をもとに、予約状況の傾向や空席が生まれやすい時期、キャンセルが起きるタイミングを分析することで、適切なタイミングで空席を埋めるためのマーケティング施策が講じられます。また、運行状況に合わせて適切な人員を割いたり、乗客のサポートを行ったりすることで、顧客満足度の向上も期待できます。

データベースや BI ツールとの違い

DWH と類似するシステムに、「データベース(DB)」と「BIツール」があります。以下では、DWHとこれらとの違いについて解説します。

データベースとの違い

データベースは目的別にデータを格納し、主に記録や編集、検索のために活用されます。また、最新情報を中心に収集を行うため、長期間の保有を行いません。

一方 DWH は、過去のデータを削除せずに収集を行います。そのため処理能力が高く、記録容量が大きいという特徴があります。加えて、分析しやすいようにデータを最適化することも可能です。

ちなみに、 DWH の関連として、「データレイク」と「データマート」という 2 つのシステムがあります。データレイクは、あらゆるデータの収集を目的としているデータリポジトリを指します。 DWH と異なり、収集するデータは利用目的が定まっておらず「非構造化データ」と呼ばれ、テキスト、画像、動画、音声、ログデータ、 GPS データといった規則性を持たないデータであることが特徴です。

対してデータマートは、ビジネスにおける特定の領域や分野、部門で利用することを前提に収集します。データマートは一部のデータベースのみを担うため用途が限定的ですが、 DWH は格納されるデータの範囲が広く、多様であることが特徴です。

BI ツールとの違い

BI ツールは、データの収集ではなく分析を目的として設計されたサービスです。 DWH に分析機能は存在しないため、 BI と連携することで初めて抽出されたデータを可視化し、レポーティングすることが可能となります。

DWH 活用メリット

では、 DWH を活用することで具体的にどのような恩恵があるのでしょうか。ここでは、 DWHの主なメリットをご紹介します。

データ収集の簡略化、効率化

DWH を導入することで、組織内のあらゆる部門に存在するバラバラなフォーマットで保存された情報を、 1 つのプラットフォームで管理できるようになります。これにより、データ収集の大幅な効率化を図れる点がメリットです。

通常、業務管理システムやソフトウェア、アプリケーションなどから取得するデータを、 1 つの場所にて統合管理することは困難です。管理に一貫性を持たせるためには、部署官でのやり取りや精査を行う必要があり、どうしても作業負担や工数の増大が避けられません。

DWH を活用すれば、データのやり取りが簡略化され、工数の削減に寄与します。また、簡略化されることで必要なデータをすぐに取り出せるようになるため、作業効率が上がり、生産性の向上にもつながります。

適切で迅速な意思決定

刻一刻と変化する市場において、膨大な量の過去データは、業務改善の判断材料として利用されます。しかしながら、それらがきちんと整理されていなければ、関連性の高いデータを的確に抽出できず、意思決定に遅れが生じかねません。

その点、 DWH は膨大な量のデータを時系列で整理してくれるため、必要なデータをスムーズに抽出できます。また、蓄積・整理された過去データを分析することで、現状を俯瞰した迅速かつ適切な意思決定が可能となります。意思決定の速さや的確さは企業間競争において非常に重要なファクターであるため、競合優位性を示すうえでも役立つでしょう。

データの履歴が参照可能

DWH ではインプットされた時間情報が付与されるため、過去の履歴がすべて時系列順に管理されています。古いデータは削除や更新によって残っていないことが多いため、長期間の顧客動向を分析するには DWH が必要になります。 また、データの上書きや記録ミスが発生したとしても、今まで発生したすべてのデータを保持しているため、バックアップとしても活用することが可能です。

まとめ

DWH は、企業が保有する業務システムの全データを一元管理し、時系列順に管理をします。企業情報を統合することで、横断的なデータ分析が可能となり、社内に蓄積された情報資源を活用した迅速な意思決定が実現します。また、基幹系システムの情報を長期間にわたって抽出できるため、業務課題の発見や改善、データ活用の効率化、生産性の向上などにも寄与します。

スタッフおすすめ記事 ベスト 3

タグ

データ活用 データ分析 オープンデータ DX 組織 ツール BI データプラットフォーム 中小企業 課題 ビジネス