CDP構築前に確認する5つのポイント
見出し画像

CDP構築前に確認する5つのポイント

こんにちは。DXnoteです。

DXnoteでは、企業のDX推進に貢献するため、データ基盤(DWH/CDP)・マーケティング基盤(MA/接客など)の側面から情報発信をしていきます。
※更新情報はTwitterでもお知らせしています。
https://twitter.com/uncovertruth_

CDPの概念が広まりつつある昨今、「CDPを構築したいが、何から手をつければいいかわからない」というご相談を非常に多くいただきます。
本記事ではそんな悩める方に向けて、構築前に確認しておくべきことを5つのポイントに絞ってまとめました。

本記事を読めば、CDP構築に向けて自社では何が足りていて、何が足りていないかを把握することができるようになると思いますので、是非チェックしていただけたら幸いです。

|1.どんなデータをもっているか?

構築に向けて一番はじめにやるべきことは、自社にどんなデータがあるかを把握することです。
まだ把握ができていない場合には「顧客がどのように自社と接点を持っているか」という観点で考えてみるといいでしょう。
業種・業態によって保持しているデータは異なりますが、一般的に保持されているデータを例に挙げてみます。
まずは、これらに当てはまるものが自社では取得しているか?さらには、どのように保管されているかを把握してみましょう。

画像1

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:58

保持しているデータは、大きく2つの管理に分かれてい場合が多いです。

自社の基幹システムに保管されるデータ
自社以外の管理化に保管されているデータ

▼自社の基幹システムに保管されている場合が多いデータ

「顧客情報/会員情報」
CDPで最も重要となる「顧客ID/会員ID」などがあり、IDに対して登録時の性別・年齢などのデモグラフィックデータ、会員ステータスなどが紐づいているデータも併せて保持していることが多いでしょう。

「購買データ」
自社ECなどのオンライン購買履歴や、店舗におけるPOSデータなどのオフライン購買履歴があります。
オンライン購買履歴であれば顧客IDに紐づく購買データが保持されていることが多いですが、オフライン購買履歴では会員アプリや会員カードを提示する仕組みがないと、顧客IDと紐づけることは難しいため、その辺りも確認が必要です。また、分析のためにも購買履歴だけでなく、商品マスターや店舗マスターなどのリストなども併せて用意するといいでしょう。

「キャンペーンデータ」
顧客情報/会員情報のデータが紐づいていることも多いですが、独立して保管している場合もあります。
各種キャンペーンへの応募履歴や応募時の回答情報(属性データやアンケートデータ)などがあります。

「メルマガデータ」
各種メルマガの開封・クリックログ、その他メルマガ内のアンケートデー
タがあります。


▼自社以外の外部システムに保管される場合が多いデータ

「アクセスログ」
Webサイトやアプリの閲覧・行動ログがあります。
Webサイトの中にはコーポレートサイト、ブランドサイト、ECサイトなどのドメインが複数に分かれていることもあります。通常は、Googleアナリティクスなどのアクセス解析ツールを利用してデータを取得している場合が多いですが、CDPに連携するときは、無償版だと生データではなく集計されたデータでの連携となってしまったり、サンプリングされてしまう可能性が高いため、注意が必要です。また、CDPツールによってアクセスログを取得する独自の計測タグを用意している場合もあります。

「SNSデータ」
企業アカウントにおけるフォロワーリストや反応データなどがあります。

「広告データ」
出稿時のコスト、インプレッション、クリックなどのデータがあります。広告代理店が運用する広告の配信管理を行う際、主にADEBiSなどの広告配信管理ツールを利用するケースが多いです。その広告管理ツールのデータを顧客に紐づけた形でCDPに連携するには有償オプション対応となることも少なくありません。

「その他」
ビーコンなどの位置情報データなどが挙げられるでしょう。
自社と関連する施設への滞在記録を顧客に紐づけられ、顧客解像度の向上や施策への活用が可能となります。

さらに、どのようなデータがあるか確認するときには、「テーブル定義書」を参考にしていくとより正確にデータを把握できます。テーブル定義書は、各データベース内で「どのようなデータ項目(カラム)」で、「どのようなデータ型(文字列か数字か、など)」かを定義したドキュメントであり、一般的にはデータベース構築時に作成していることが多いです。
下記画像のようなイメージのものとなり、システム部門に「〇〇データのテーブル定義書をください」と言えば伝わると思いますので、まずはそこから聞いてみましょう。

画像2

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:60

|2.どのようなデータタイプ(型)なのか?

ここまで、どのようなデータがあるか説明してきましたが、データにはタイプや型があります。
少し複雑ではありますが、体系的に理解しておくことで、CDPを構築するときにより円滑に進められるようになるでしょう。

データタイプ(型)

▼「構造化データ」と「非構造化データ」
簡単にいうと「データがテーブル形式で整理されているか」という違いであり、前述している顧客情報/会員情報や購買データなどは、基本的に行と列でデータの値や数字が整理されており、構造化データにあたります。
対して画像や音声、PDFなど、データとしてばらばらに存在しているものは非構造化データにあたります。
CDPでは構造化データを中心に扱うことが多いということを覚えておいてください。

▼「マスターデータ」と「トランザクションデータ」
構造化データの中には「マスターデータ」と「トランザクションデータ」の2タイプがあります。
マスターデータは、更新頻度が低く基本的な情報が格納されたデータであり、顧客情報/会員情報や商品リスト、店舗リストなどが該当します。
一方、トランザクションデータは、更新頻度が高く出来事の詳細を記録したデータであり、購買履歴やアクセスログが該当します。
各データテーブル名には、マスターデータであれば「m_」やトランザクションデータであれば「t_」を付けることがあります。

画像3

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:61

図のとおり、マスターデータの例では、顧客IDというキー情報に対して必ず一意にデータが整理されてあります。
キー情報は顧客IDだけでなく、商品IDや店舗IDなども対象になります。
対してトランザクションデータの例では、購買履歴のように購入という出来事の詳細として記録したデータであり、顧客IDのようなキー情報は複数行にまたがっている状態です。
このように、データを扱う際にはそのデータがマスターデータとトランザクションデータのどちらに該当するのか理解しながら、データ基盤を構築していくとよいでしょう。

◆データテーブルの構造
データテーブル(表)はレコード(行)とカラム(列)で構成されています。
扱うデータテーブルが何カラムあるか、何レコードあるか確認していく作業があることを理解しておきましょう。

画像4

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:62

◆データ型
上記の図のようにデータの値には「AAA(文字列)」や「2019/08/31(日付)」「2(数値)」など、さまざまな表現があります。
それぞれに特性やフォーマットがあり、これらを「データ型」と呼びます。
このデータ型を考えずデータを読み込んでしまうと、誤った状態でデータを管理することになります。

画像5

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:62

このように文字であれば文字列型、日付・時刻であれば日付型、数値であれば数値型と分けられます。
また、少し細かいですが、それぞれの型からさらに種類が派生していき、文字列型であれば「char 型」「varchar型」のように分かれていきます。
テーブル定義では、この派生した型で定義していきます。
よく使うものに限り、表にまとめていますので、定義時に活用してみてください。

画像6

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:63

◆PK(Primary Key)、FK(Foreign Key)
CDPのように複数の関連したデータを扱う場合、PK(Primary Key)やFK(Foreign Key)も非常に重要になるため理解しなければいけません。
PKは「主キー」とも呼ばれ、データテーブルにおいてレコードを一意に識別する項目を意味します。
顧客データであれば顧客ID、商品データであれば商品IDが該当します。

FKは「外部キー」とも呼ばれ、関連するテーブルを結びつける際に突合キーとなる項目を指します。
顧客データを例にとると、住所にあたる「都道府県」が「北海道」とは格納されず、「01」のような「都道府県ID」として格納され、都道府県リストのデータと紐づけて管理することがあります。
この場合、顧客データと都道府県リストは「都道府県ID」で結びつけることができ、FKとなります。

|3.どうやってデータを連携させる?

自社にどのような種類のデータがあるか把握できたら、次はデータ同士の連携構造を整理しましょう。
図を参考にまずはデータを並べ、キー情報となるIDを各データに記載します。
次に同じ値が入るID同士を線で結んでください。そうすることで、次図のように各データがどのIDに紐づくか、顧客にどんなデータが統合されるかイメージが付くでしょう。

画像7

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:64

このときに注意する点として、同じ値が入っているのにID名が異なる場合や、逆にID名が同じでも入る値が異なる場合があります。
上記の図を例にすると、顧客情報/会員情報の「customer_id」とアクセスログの「user_id」はどちらも同じ会員ユーザーのIDでありながら、異なる項目であるというケースがあります。

このような事象はときどき起こりますが、その多くが顧客情報の管理部門とアクセスログ管理部門が異なっており、データカラム名のルールが統一されていないことが原因です。
そのため、同じ名前のIDや異なるIDだとしても、実際にどのようなIDを収集しているのか、実際に紐づくかどうか、テーブル定義書や実際のデータを見ながら確認する必要があります。

また構造図を描くときに参考となるものに、各データベースに「ER図(Entity Relationship Diagram)」と呼ばれるデータベースの設計図があります。
ER図にはさまざまな書き方・手法がありますが、各データテーブル間におけるPK、FKが記載されたり、リレーションがどのような状態か(1対1、1対多など)記載されます。
下図にER図の部分的な例を示します。ここでは詳細を理解する必要はなく、ER図がどのようなものか把握しましょう。

画像8

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:65

|4.どのようにIDを一意に管理する?

CDPで顧客を統合するにあたって、顧客IDをどのように連携するかだけでなく、顧客IDをどのように一意に管理するか、という点が重要となってきます。
元々、各データソース内でIDを収集し、顧客をユニークにとらえる一意のID(前述のPK:主キー)を管理しています。
CDPで複数のデータソースを統合する際に、一意化するIDの優先度を設定する必要があります。
このような複数データのIDを統合し、一意化する処理を「名寄せ」といいます。

ここでは名寄せの流れを例に沿って説明していきます。
下記のような「会員情報」と「アンケート情報」「アクセスログ」のデータがあるとします。

画像9

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:65

それぞれデータの取得方法ごとにIDが振られています。
それぞれのIDからどれを優先度高く設定すべきかを考えていきます。
これらのデータ(ID)が紐づいている状況を、ベン図で表すと下記のようになります。

画像10

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:66

会員情報❶を含む重複部分❹❺❼は会員にあたり、❷❸❻は非会員にあたります。
会員情報さえ取得できていれば顧客を一意に紐付けることは難しくなさそうですが、CDPで顧客を一意に管理していくにあたり、できれば非会員についても顧客として捉え管理できる構造にしておきたいですよね。
どのようにすればいいのでしょうか。
更に具体的にした例をみてみましょう。

画像11

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:66

前図のようにABCDの顧客は、各データソースを単一利用、重複利用など、さまざまな状態となっています。
Cのように、アクセスログなど一つのデータソース内に複数IDを持つ顧客も存在します。
一意化する目的は、顧客をユニークに認識することであるため、データ取得上、顧客をユニークに取得できているIDの優先度が最も高くなります。
多くの場合は会員IDがそれにあたるでしょう。

しかし今回、仮に会員情報だけで顧客を管理しようとするとDの人は管理できなくなってしまいますね。
そこで、名寄せを行う際の手段として、ABCDの顧客を一意化する「統合顧客ID(common_id)」というものを付与する方法があります。

今回の例だと「会員ID(会員情報)>回答者ID(アンケート)>訪問者ID(アクセスログ)」の優先度を設定し、優先度の高いIDがcommon_idに発番される仕組みとします。
そうすることで非会員の顧客も一意に捉えることができ、且つその顧客が後に会員化した際に統合顧客IDで紐づくことで、過去の行動までも追えるようになっていきます。(※データの保持期間等にもよってきます)

|5.CDP構成図で全体像を可視化してみる

ここまで、企業が保有するデータ種類、データ同士の連携構造について説明してきました。
最後に、データ収集から施策連携までを構造化した「CDP構成図」の描き方について説明します。
図のように、作成するフォーマットは「データ収集」「データ統合・分析」「施策への連携」の3フェーズごとにまとめていきます。
矢印はデータの流れを表しています。

画像12

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:67

「データ収集」フェーズ
「自社データ」と「外部データ」に分け、収集可能なデータを記載していきます。
ここではデータテーブルごとの細かい粒度ではなく、データベース(データの種類)の粒度で書くことをおすすめします。

「データ統合・分析」フェーズ
導入する「CDPツール」を記載します。
場合によっては複数のツールを描くこともあります。
また、BIツールと連携する場合は、このフェーズ内で記載します。

「施策への連携」フェーズ
「広告」と「CRM・メール・Web接客」に分け、該当するツールを記
載します。

内容を入れ込んだ具体例を挙げて見てみましょう。

画像13

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:68

あくまで一例ですが、簡単な図ではあるものの、CDP構成図をつくることで施策実行を見据えたビジョンが明確になります。

|まとめ

いかがでしたでしょうか?
CDP構築は、実際にやろうと思うと正直簡単ではありませんし、各社でデータの持ち方も異なるため、前例のないパワーのかかるプロジェクトとなることが多いです。
ですが、まずは自社のデータ構造や状況を今回のようなフォーマットに当てはめて体系的に理解することで、今自社では何が必要であるかが見えてくるはずです。

是非皆さんもこの記事を参考していただけたら幸いです。

ーーー

「CDP無料診断」やっています!マーケティング課題に対してCDP活用をお考えの皆様へ、目的実現のために在るべきデータ構造を貴社に合わせて弊社が診断・ご提案いたします。



最後までお読みいただきありがとうございます!UNCOVER TRUTHのニュース、更新情報をTwitterで発信しています。

ありがとうございます。よろしければシェアもお願いします♬
CRMエージェンシーとして、クライアント企業のオンラインとオフラインの統合データ分析・コミュニケーション施策立案・実行PDCA運用などのデジタルマーケティング活動支援を行うUNCOVER TRUTHがノウハウや実例を織り交ぜてお届けする、DXマーケ担当者を応援するメディアです。