【DX検定対策講座】第2編ー⑤|データ基盤を構築する ― MDM・データレイク・DWH

■ 本講の位置づけ

第2編ー①〜④では、

戦略設計

顧客起点設計

MVP検証

内製化

まで扱いました。

しかし、ここで重要な問いがあります。

改善を回すための「データ」は、どこにどう保存されているのか?

DXはデータが前提です。

データ基盤を理解しないと、DXは成立しません。


第1章|MDM(マスタデータ管理)とは何か

■ 定義

MDM(Master Data Management)とは、企業内で分散している顧客・商品・取引先などの基幹データを統合し、「単一の正しいデータ(Single Source of Truth)」を維持する仕組みです。

DX検定では、

「単一の正しい顧客データを整備する取り組み」

が正解になります。


■ なぜMDMが必要か

多くの企業では、

  • 営業部門の顧客データ
  • ECサイトの顧客データ
  • コールセンターの顧客データ

が別々に存在します。

結果:

  • 名前表記揺れ
  • 重複登録
  • 住所不一致

となります。


■ 問題例

顧客A:

  • 営業DB:山田 太郎
  • EC:Yamada Taro
  • サポート:山田太郎

同一人物なのに別人扱い。

これでは、

  • 正しいLTV計算ができない
  • パーソナライズ施策が失敗する
  • 解約リスク予測がズレる

■ MDMの役割

データ収集

正規化

統合

唯一のID付与

全システムへ配信

MDMはデータの正確性と一貫性を担保する基盤です。


第2章|データレイクとは何か

■ 定義

データレイクとは、構造化データ・非構造化データを含む“生データ”を大量に保存できる基盤です。

DX検定では、

「構造化・非構造化を含む生データを大量に保存できる保管基盤」

が正解です。


■ どんなデータが入るか

  • ログデータ
  • センサーデータ
  • 画像
  • 音声
  • JSONデータ

つまり、

整理前のデータ

が保存されます。


■ 特徴

・形式自由
・保存優先
・後から加工

データレイクは「とりあえず保存する湖」です。


■ 注意点

整理せずに放置すると、

データスワンプ(沼)

になります。

検索不能、利用不能。

そのため、

  • メタデータ管理
  • データカタログ

が重要になります。


第3章|DWH(データウェアハウス)とは何か

■ 定義

DWH(Data Warehouse)とは、分析・レポート用途に最適化された、統合・整理済みのデータ基盤です。

DX検定では、

「分析・レポート用途に統合・整理されたデータを格納する基盤」

が正解です。


■ データレイクとの違い

観点データレイクDWH
データ状態生データ整理済
用途保存分析
スキーマ後定義事前定義

■ 例:売上分析

DWHでは、

  • 日付
  • 商品カテゴリ
  • 地域
  • 顧客属性

が整理された状態で保存されます。

そのため、

月別売上
地域別売上
顧客属性別売上

が即座に分析可能です。


第4章|3つの役割を統合する

ここまでを統合します。

データ発生

データレイク(保存)

MDM(正規化・統合)

DWH(整理・分析)

■ 構造理解が重要

  • MDM=正しいデータを作る
  • データレイク=全部貯める
  • DWH=分析できる形にする

この役割の違いがDX検定で問われます。


第5章|実務ケース:小売企業のデータ基盤

課題

  • 店舗POSデータ
  • ECデータ
  • 会員アプリデータ

が分断。


解決

① データレイクに全データ保存
② MDMで顧客ID統合
③ DWHで分析用テーブル作成


■ 結果

  • 顧客LTV可視化
  • 購買傾向分析
  • レコメンド精度向上

データ基盤はDXの土台です。


第2編ー⑤まとめ

  • MDM=単一の正しいデータを作る
  • データレイク=生データ保存
  • DWH=分析基盤
  • 役割を混同しないことが重要

■ 解けないと危険?第2編の確認テスト

📊 第2編 総合確認テスト

ここまで理解できたら、実際の形式で確認しましょう。

問11〜20に今すぐ挑戦する
上部へスクロール