CDPのデータをもとに機械学習に触れてみよう~その①データを集める~
見出し画像

CDPのデータをもとに機械学習に触れてみよう~その①データを集める~

こんにちは。DXnoteです。

DXnoteでは、企業のDX推進に貢献するため、データ基盤(DWH/CDP)・マーケティング基盤(MA/接客など)の側面から情報発信をしていきます。
※更新情報はTwitterでもお知らせしています。
https://twitter.com/uncovertruth_

今回はCDPのデータを使って機械学習に触れてみようという内容です。

CDP(カスタマーデータプラットフォーム)についてピンと来ていない方は
CDPってなに?をまとめてありますので、こちらも併せてご覧ください☟

最近のnoteで書いているCDPとAIについては、こちらにまとめてありますので、ぜひこちらもご覧ください☟

|CDPのデータをもとに機械学習に触れてみよう

CDPではさまざまなデータを蓄積しているので、それぞれのデータが顧客軸でつながっていることと思います。今回はECサイトを例にして、下記があると仮定して解説します。

例)ECサイトの下記データを蓄積している
・顧客属性データ
・購買データ
・Web行動データ

上記のデータを使って、具体的にどのようなプロセスを経て、予測AIができるのかを全④回にお伝えしていきます。

まず、予測の目的はさまざまですが、今回は「1ヵ月以内に購入してくれる人を予測する」ことを目的に予測モデルをつくる方法をお伝えします。予測の目的が決まったら、以下のようなプロセスで進めていきます。

予測の目的が決まった後のプロセス
①データを集める
②データを整形(前処理)する
③ 学習させる
④予測させる

画像1

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:155

今回のnoteでは①データを集めるについてお伝えしますね。

CDPの話もそうなのですが、特にAI周りは馴染みのない用語が多くあるかもしれません。少ないですが、こちらにも用語解説を載せていますので、必要に応じてごらんください☟※適宜追加しています。

|データを集める

まずは、予測モデル構築のために教師データを集めるところからはじめます。(教師データとは、機械学習に用いる、例題と正解のペアになるデータのことです)予測モデルの精度を高める上でデータの「量と質」は欠かすことのできない要素です。

・量について
「量」については予測する目的にもよりますが、今回のテーマ「1ヵ月以内に購入してくれる人を予測する」では、少なくとも購入者(正例)・非購入者(負例)それぞれで1,000人以上のデータは確保したいところです。データ量が少ないと、予測の精度が低くなる可能性が上がります。もし今回の予測目的で、一つの集計期間で十分なデータ量が確保できない場合は「11月末までのデータで12月に購入してくれた人」「10月末までのデータで11月に購入してくれた人」など、期間を変えたデータを準備して、学習させるためのデータ量を確保する準備が必要になります。

画像2

出典 著者名:小畑 陽一 (著), 菊池 達也 (著), 仁藤 玄 (著) 書名:ユーザー起点マーケティング実践ガイド 出版社:マイナビ出版社 出版年:2021 該当ページ:156

特に予測したい目的に対するユーザー数は、それ以外のユーザーよりも圧倒的に少ないことはよくあります。(購入する人を目的にしている場合は、購入しない人の方が圧倒的に多い場合も珍しくないですよね)そのため、その目的を達成しているユーザー数を確保するにはどのくらいの期間のデータが必要か?を事前に把握しておき、十分なデータ量が確保できる期間を設定しましょう。

・質について
予測の目的に対して、どのようなデータ項目が必要か?を見極めることが重要です。CDPの中にはさまざまなデータが格納されているはずですから、紐づけようとすれば色々なデータを利用できますね。ですが、予測目的に関係のないデータばかり集めても予測の精度を高めることは期待できません。予測したい目的を達成している人、達成していない人はどんな人でどんな行動をしているかをしっかり把握+想像し、その特徴が表れるであろうデータ項目を選択しましょう。どのデータ項目を選ぶべきかを検討するために、CDP内のデータを事前に分析して顧客の特徴をつかんでおいても良いと思います。

ーーー

この続きは、CDPのデータをもとに機械学習に触れてみよう~その② データを整形(前処理)する~でお伝えします。また次回お会いしましょう!
※更新情報はTwitterでもお知らせしています。https://twitter.com/uncovertruth_

✏この記事の著者✏

画像3

小畑 陽一(オバタ ヨウイチ)
株式会社UNCOVER TRUTH 取締役 COO
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
music.jpやルナルナを手がけるエムティーアイ社出身。ソリューション事業責任者として、大手企業向けモバイルサイト構築ソリューションで、国内ナンバーワンのASPサービスを展開。2014年、取締役として株式会UNCOVER TRUTHの取締役COOとして経営に参加。経営・事業戦略とマーケティングを管掌。ad:tech Tokyo / Kyushu、宣伝会議、MarkeZine、Web担当者フォーラムなど講演活動多数。
著書:『ユーザー起点マーケティング実践ガイド』(CDP専門書籍)

最後までお読みいただきありがとうございます!UNCOVER TRUTHのニュース、更新情報をTwitterで発信しています。

ありがとうございます。よろしければシェアもお願いします♬
CRMエージェンシーとして、クライアント企業のオンラインとオフラインの統合データ分析・コミュニケーション施策立案・実行PDCA運用などのデジタルマーケティング活動支援を行うUNCOVER TRUTHがノウハウや実例を織り交ぜてお届けする、DXマーケ担当者を応援するメディアです。