目次
🧱 データ基盤とは|データ活用の“土台”をつくる仕組み
DXの中心にあるのは データ活用。しかし、データがバラバラ・形式が違う・意味が揃っていない状態では、分析もAI活用もできない。
そこで必要になるのが データ基盤(Data Platform)。
データ基盤は、
データを集める → 整える → 使える形にする
という一連の仕組みを支える“土台”。
その中心となるのが ETL と データカタログ(メタデータ管理)。
🔄 ETLとは|データを「抽出 → 変換 → 格納」するプロセス
ETLは Extract(抽出)・Transform(変換)・Load(格納) の頭文字。
▼ETLの図解イメージ(文章版)
データ源(基幹システム・CSV・API)
↓ Extract(抽出)
加工・整形(形式統一・欠損処理)
↓ Transform(変換)
データウェアハウスへ保存
↓ Load(格納)
📊 ETLの3ステップ(表で整理)
| ステップ | 内容 | 例 |
|---|---|---|
| E:抽出 | さまざまなシステムからデータを取り出す | 基幹DB、Excel、ログ、API |
| T:変換 | 形式を揃え、加工し、使える形に整える | 日付形式統一、欠損補完、結合 |
| L:格納 | データ基盤(DWH/データレイク)に保存 | BigQuery、Snowflake、Redshift |
💡 初学者向けの理解ポイント
- ETLは データ分析の前処理を自動化する仕組み
- データがバラバラのままでは分析できない
- DX検定では「抽出・変換・格納の流れ」を理解しておくと得点しやすい
📚 データカタログとは|データの“辞書”をつくる仕組み
データカタログは、
データの意味・定義・所在・更新頻度などを整理した“データの辞書”。
DX検定では次の理解が正解。
データの意味や定義を揃えるために整備するもの=データカタログ/メタデータ
📘 メタデータとは?
メタデータとは “データについてのデータ” のこと。
例:
| データ項目 | メタデータ(意味・定義) |
|---|---|
| user_id | 顧客を一意に識別するID |
| order_date | 注文が確定した日付(YYYY-MM-DD) |
| sales_amount | 税込売上金額(円) |
📊 データカタログで管理する内容(表)
| 種類 | 内容 |
|---|---|
| ビジネスメタデータ | 用語の定義、意味、計算方法 |
| テクニカルメタデータ | データ型、カラム名、保存場所 |
| オペレーショナルメタデータ | 更新頻度、データ品質、取得元 |
💡 なぜデータカタログが必要なのか?
- 部署ごとに「売上」の定義が違う
- 同じ項目でも計算方法が異なる
- どのデータを使えばいいかわからない
- データの意味が属人化している
こうした問題を解決し、
全社で同じデータを同じ意味で使えるようにする のがデータカタログ。
🧩 ETLとデータカタログの関係性
文章図解で整理するとこうなる。
ETL:データを集めて整える仕組み
データカタログ:整えたデータの意味を揃える仕組み
どちらが欠けても、データ活用はうまくいかない。
- ETLだけ → データは整うが、意味がバラバラ
- カタログだけ → 意味は揃うが、データが整っていない
DX時代のデータ活用には 両方が必須。
📝 今すぐ練習問題(Q31〜Q40)を解きたい方へ
学んだ内容をすぐ確認したい方は、こちらの問題アプリから挑戦できます。
👉 DX検定|練習問題(Q31〜Q40)
【一問一答形式】DX検定を受験する方へ! 無料の練習問題アプリ 31~40問
(※この記事の内容がそのまま出題範囲になっています)
📘 第4編ー②へのつながり
データ基盤を整えた次のステップは、
データを使って“検証”し、“公平性”を担保すること。
次の第4編ー②では、
- A/Bテスト
- AIのバイアス(公平性の問題)
をわかりやすく解説していくよ。
【DX検定対策講座】第4編ー②|データ活用の実践(A/Bテスト・AIバイアス)


