データを蓄積・活用するために役立つ4つのツールとは

経営や商品開発、マーケティングなどにおいてデータの活用が当たり前の時代となりましたが、どのようなツールでデータを蓄積・管理すべきか分からない人も多いでしょう。これには、データレイクやDWH、DMP、CDPなど一見似たようなデータの蓄積ツールが多いことが一因となっています。
そこでこの記事では、データレイク、DWH、DMP、CDPという4つのツールの概要や特徴、用途などを整理します。

1. データ蓄積ツール① データレイク

1. データ蓄積ツール① データレイク

データレイクとは

データレイクとは、データを加工せず生データのまま格納できるストレージのことです。データの項目や型・桁、サイズなどは様々であるため、一般的にはデータベースにデータを格納する際にはあらかじめデータを加工したうえで、形式が決まった構造化データベースに格納します。一方で、データレイクには任意の項目・型・桁を持ったデータをそのまま格納することができます。
データレイクにはある意味雑多にデータが格納されていますので、データレイクを利用する際には必要な情報のみを抽出するための条件指定が必要となります。このような特徴から、データレイクは「スキーマオンリード(= 読み込み時に形式を選択するタイプ)」のデータベースとも呼ばれます。

データレイクの特徴

上述の通り、データレイクの最大の特徴は生データを格納できることにありますが、それ以外にもデータレイクには以下のような特徴が存在します。

  • データ構造:構造化されていない任意の形式の生データを格納できる。
  • コスト:ストレージサービスの中では比較的低価格で利用できるため、大量のデータを格納しやすい。
  • データ格納の柔軟性:どのようなデータでも格納可能であるため、柔軟にデータを格納できる。
  • 利用ユーザー:ユーザー側でデータの抽出や取捨選択を行う必要があるため、主にデータサイエンティストやエンジニアなど、IT技術者向けとなる。

主な用途

生データを保持できる特徴や低コストで運用可能であることから、データレイクは利用するか確実ではないが有用なデータを大量に格納しておくのに便利です。このような使い方が有効となる例は以下の通りです。

  • IoTで得られるデータの保持:センサー等のIoTデバイスから得られるデータは大量なものになるため、データレイクにて低コストで保持することが有効となる。
  • AIの活用:AIはその特性上、実際にデータを学習させるまで成果が分からないため、どのデータが有効か事前にわからない。データレイクに格納された大量かつ多種類のデータはAI活用の可能性を広げるために有効となる。

データレイクを構築できるサービスの代表的なものとしては、「Amazon Simple Storage Service(Amazon S3)」が挙げられますが、「Wasabiオブジェクトストレージ」は、このAmazon S3のAPIと高い互換性があります。
そのため、Amazon S3で使用しているアプリケーションをそのまま利用でき、バックアップやリカバリもシームレスに行えるのが特徴です。
そのほかにも、ストレージ利用料が業界最安値水準など、さまざまなメリットがあるWasabiオブジェクトストレージについて、くわしく知りたい方はこちらをご覧ください。

2. データ蓄積ツール② DWH

DWHとは

DWHとは「Data Ware House」の略称であり、様々なシステムからデータを集めて格納するデータベースを意味する言葉です。多様なデータを収集することで、より高度な分析を実現することができます。例えば、販売システムで保持している売上データと製造システムで保持している生産データをクロスで分析して、より高度な生産計画を立案するケースなどが考えられるでしょう。
一般的に、自社システムの多様なデータは、システムにより重複があったり形式が異なったりするため、自社データを集約して活用するためにはデータを整える作業が必要となります。そこで、DWHにデータを格納する際には、データをクレンジングしたうえで、多様なデータを構造化して利用しやすいよう状態にします。この作業は大変ではありますが、一度構造化されたデータはビジネスユーザーなどITに関する知見がないユーザーでも利用しやすいものとなります。

DWHの特徴

前述したデータレイクとは異なり、DWHの最大の特徴は構造化されていることにあります。これにより、以下のような特徴があります。

  • データ構造:構造化されたデータを格納する。データレイクとの対比で、DWHは「スキーマオンライト(= 書き込み時に形式を定めるタイプ)」のデータベースとも呼ばれる。
  • コスト:データレイクと比較すると高い傾向にあるが、データベースのスペックによっても異なる。
  • データ格納の柔軟性:事前に定められた形式のデータのみ登録可能であり、想定外のデータを登録する場合はDWHの修正が必要。
  • 利用ユーザー:ユーザー側でのデータ抽出が容易であり、BIツールなどを用いることでデータの可視化も可能。

主な用途

上述したDWHの特徴からもわかるように、DWHはビジネスユーザーなど一般ユーザーでも利用できることがポイントとなります。これにより、主に以下のような用途で用いることができます。

  • ビジネス計画における基礎データ:商品開発、生産計画、マーケティングなどの計画を立てる際に、DWHから抽出した過去の売上や製造実績を活用することができる。
  • 各種報告資料などの作成:DWHからデータを抽出し、グラフ化やレポーティングなどを行うことにより、当月の売上情報をはじめとした報告資料の作成が可能となる。

3. データ蓄積ツール③ DMP

3. データ蓄積ツール③ DMP

DMPとは

DMPとは「Data Management Platform」の略称であり、マーケティングに必要となるデータを集約して格納したデータベースのことです。顧客に関する様々なデータを収集し、一元的に保持することで、高度なマーケティングに用いることができます。
DMPは、自社で保有するデータ(いわゆる1stパーティデータ)を中心に自社用に用意されるプライベートDMPと、第三者が保有する外部データ(いわゆる3rdパーティデータ)を提供するパブリックDMPの2つに分かれます。
DMPは近年登場した概念であり、用語の定義が定まっていない部分もあります。以下では、まずDMPのうちパブリックDMPを対象に解説を行い、のちにCDP(≒プライベートDMP)について紹介したいと思います。

パブリックDMPの特徴

パブリックDMPは上述した通り第三者が保有する3rdパーティデータを提供するものであり、企業はパブリックDMPの提供企業からデータを購入して利用します。パブリックDMPの特徴を整理すると以下の通りとなります。

  • 取り扱うデータ種別:ブラウザやスマートフォンをキーとした年齢・性別等の属性データやユーザーの興味関心、Web上での行動履歴など。
  • データの量:第三者がデータを収集、保持しているため、大量のデータを保有する。また、自社の顧客以外のデータも保持している。
  • データの質:年代や興味関心など、一部データは推定から得られているため、必ずしも確実でない要素も含まれる。

主な用途

パブリックDMPは、主に自社以外も含めた多数の顧客情報を保持するという特徴から、以下のような用途で用いられます。

  • Web広告の最適化:ユーザーのWeb上での行動履歴や興味関心などから、自社がWebで出稿する広告の最適化分析に用いることができる。
  • 新規顧客の開拓:自社が保有していない潜在顧客のデータを取得できるため、新規顧客の開拓に用いることができる。
  • 自社データと組み合わせたマーケティングの高度化:自社が保有する顧客情報と組み合わることで、顧客のより詳細な情報を把握し、より高度なマーケティングを実施することができる。

4. データ蓄積ツール④ CDP

CDPとは

CDPとは「Customer Data Platform」の略称であり、自社が保有する複数の情報システムからデータを収集し、顧客をキーとしたデータベースを構築することを意味します。自社の顧客データを一元化することで、例えば事業Aの顧客データと事業Bの顧客データを組み合わせて、より高度なマーケティングを実現することができます。
CDPは前述したDMPのうち、プライベートDMPに近しい概念であり、必要に応じて自社データだけではなくパブリックDMPからデータを取得し、自社データと組み合わせて利用することもあります。

CDP(プライベートDMP)の特徴

CDP(プライベートDMP)は上述した通り自社が保有する1stパーティデータを中心に構築するものです。プライベートDMPの特徴を整理すると以下の通りとなります。

  • 取り扱うデータ種別:主に自社保有の顧客データを収集し、一元化したもの。場合により、パブリックDMPなどから他社保有の顧客データを加える。
  • データの量:主に自社顧客のデータが中心となるため、パブリックDMPと比較するとデータ量は少なくなる傾向にある。
  • データの質:申し込み時やアンケートなどで得られた情報が中心となるため、データの正確性は高い傾向にある。

主な用途

CDP(プライベートDMP)は、主に自社顧客の情報を一元的に保持するという特徴から、以下のような用途で用いられます。

  • 優良顧客のターゲティング:いわゆる「お得意様」と呼ばれるような、自社サービスを多数利用している顧客を抽出し、囲い込みなどの対象とすることができる。
  • 自社顧客のアップセル・クロスセル:複数の事業やサービスの顧客データを統合して分析することで、既存自社顧客に対してより高付加価値の高いサービスや、自社が提供する他サービスを営業し、売上の拡大を狙うことができる。

データは構造化・非構造化など種類に応じて、さまざまな蓄積ツールがあります。NTTデータの「Smart Data Platform」(SDPF)と連携している「Wasabiオブジェクトストレージ」は、こうした蓄積ツールの特徴を併せ持つサービスと言えるかもしれません。
Wasabiのクラウドストレージで無制限に保管したデータは、必要な時に取り出しSDPFのクラウドでAIを用いた詳細な分析が可能です。ひとつのツールで保管から分析までできることで、全体的なコストも削減でき、分析したデータは品質や生産性向上に役立てられます。活用シーンが幅広い本サービスについては、こちらでさらにくわしくご紹介しています。

まとめ

この記事では、多様なデータ蓄積ツールが登場しているという現状を踏まえ、データレイク、DWH、DMP、CDPという4つのツールについて解説を行いました。データは現代的で高度な企業経営・事業推進における重要な要素となっています。ただし、データの活用においてどのようなツールを用いるべきかについては、その用途に応じて様々でもあります。自社の目的を整理したうえで、適切なツールを選択していくことがデータを有効活用するためのキーポイントとなるといえるでしょう。

NTT コミュニケーションズで提供するWasabiオブジェクトストレージは、業界最安値の利用料金に加え、主要なストレージサービスでは費用が発生するデータの転送料金が無料です。これによって、本記事で紹介したデータレイクを非常に低コストで構築できます。

WasabiオブジェクトストレージはAmazon S3と互換性のあるAPIを持っているため、Amazon S3に対応したその他のツールも利用可能です。低価格で信頼感のあるストレージサービスをお探しの方は、ぜひ導入をご検討ください。

こちらもチェック!
あわせて読まれている おすすめ記事

Smart Data Platform は、
お客さまのデジタル課題に合わせた
最適なサービス・プランの組み合わせを
ご提案することができます

新規導入のご相談やお見積、サービス仕様など
ご不明な点があればお気軽にお問い合わせください

お問い合わせ

お問い合わせ

このページのトップへ