Media × Tech

「Media × Tech」ブログはスマートニュースのメディア担当チームが運営するブログです。テクノロジーを活用した次世代のメディアとはどういうものか? そうしたメディアをどうやって創り出していくのか、を考えていきます。

画像の評価、複数のデータソースで記事分析…Googleデータポータルを便利に使う7の方法

こんにちは、スマートニュースの有野寛一です。

普段、アプリ「SmartNews」で日々媒体社が配信する記事が、ユーザーにどのように読まれているのかを分析する業務に携わっています。

分析結果は依頼者に、「どのように読まれた」かの抽象的なコメントだけを共有する場合もあれば、細かい数値を集計してExcelやスプレッドシートなどで再加工できるデータで渡す場合もあります。

しかし、PDFやドキュメントとして送付するとデータ量が多くなってしまったり、データを触りながら考察を深めたいニーズがあったりする際には、Googleのデータポータルで渡すことが増えてきました。

marketingplatform.google.com

データポータル(旧データスタジオ)とは、Googleが提供するクラウドベースのデータ分析ツール。Google Analyticsやスプレッドシート、Google広告のデータを簡単に結びつけ、レポートやダッシュボードを作成できます。

前職の出版社では、Google Analyticsと連携してデータポータルを使用していました。データの可視化(ビジュアライズ)が簡単で、閲覧権限も柔軟に管理できるので、社内での共有に最適でした。

現職になり、ほとんど使うことがなかったのですが、久しぶりに使用した際に、多くの機能が追加され、より深くデータ分析を行える環境になっていると感じました。

今回はデータポータルを便利に活用するためのTipsをまとめました。ぜひ参考にしてみてください。

Point1. Google Analytics以外のデータソースを連携できる

おそらく、既にデータポータルを使っている多くの方は、Google Analyticsをデータソースに、日々のウェブサイトのパフォーマンスのモニタリングをすることを主な用途にしていると思います。

しかしデータポータルは、Google Analyticsだけはなく、外部配信先のPVデータなど、複数のデータソースと連携して、表示することが可能です。

例えば、自社で運営するウェブサイトの記事パフォーマンスをGoogle Analyticsで表示し、外部配信先であるSmartNewsの記事パフォーマンスのデータをCSVで取り込み、同じ記事がそれぞれでどのように読まれたのかを確認できます。

「データを追加」 から追加したいデータの種類を選択します。

「データソース」「データを統合」 を選ぶと、現在のデータソースに追加できる「別のデータソースを追加」 が表示され、追加したいデータソースを選択します。

f:id:kan1arino:20210326202351p:plain

「結合キー」 で、両方のデータソースにあるディメンションを選びます。 この場合、重複がないディメンションを選ぶのが適切で、記事のURLが該当します。

f:id:kan1arino:20210326145535p:plain

「結合キー」 は左側に表示されているデータソースが優先されるので、左側のデータソースにないものは表示されません。

ちなみにSmartNewsのパフォーマンスデータは、記事配信をしている媒体社であれば、「Insights」という専用サイトから取得できます。

Point2. 正規表現を使ってURLをユニークにできる

媒体ごとのパフォーマンス分析の際に必須となるのが、記事データを同一URL単位で集計することです。しかし、SNSシェアを通じたアクセスなどで、ページのURLに意図しないパラメータが付与され、集計時に同一にならない場合があります。先に紹介した「データの統合」 でディメンションに記事URLを使用する際にもパラメータがあることで結合できないことがあります。

そんな時には「計算フィールド」 でテキスト関数を使用し、パラメータを削除します。

今回は、FacebookでシェアされたURLを例に、パラメータを削除する例を紹介します。

編集画面時、右下にある「フィールドを追加」 を選びます。 計算式で

REGEXP_REPLACE(ページ,'\\?fbclid=.','')

を入力します。*1 文字列で正規表現パターンを検索し、このパターンのすべての出現を特定の文字列に置き換えることができるテキスト関数です。

f:id:kan1arino:20210326202517p:plain

新しくフィールドが追加されると、パラメータが削除されたURLで集計されます。

f:id:kan1arino:20210326202539p:plain

Point3. CTRやPVの高かった画像を評価できる

「CTRが高かったサムネイルはどのようなものか」など、画像を対象にした効果測定を行いたい場合があります。 そんな時、データポータルでは画像をディメンションとして扱い、CTRごとやPVを比較するデータを作ることができます。

対象にするデータのうち、画像のURLに当たる要素について、タイプをURLから「画像」 に変更します。

f:id:kan1arino:20210326203045p:plain

すると、データ上で該当URLがURLの形ではなく画像として表示されるようになります(画像のディメンションは表のみで利用可能です)。

サンプルでは、スプレッドシート上でimpressionとPVの散布図を作成し、特定のCTRのデータを選択した時にサムネイルが表示されるようにしてみました。*2

f:id:kan1arino:20210326203153g:plain

Point4. 位置情報を地図上にマッピングできる

Google Analyticsで地域を使用する際には、特別な設定をせずに、地図上にマッピングできますが、Google Analytics外の会員登録データや購買データなどからの位置情報(緯度経度や地域名)を使用したい場合があります。

そんな時も、データポータルを使えば、地図上にマッピングできます。

以下のように、 「都道府県」、「都道府県+市町村」または「緯度経度」を入れ、該当するデータを準備します。サンプルでは「都道府県+市町村」の例です。 「緯度経度」の場合は、35.6897,139.6895 と、カンマ区切りで、緯度, 経度 の順に入力する必要があります。

f:id:kan1arino:20210326203342p:plain
都道府県+市町村と対応するデータ

地域に該当するフィールドを

  • 「都道府県」・・・地域
  • 「都道府県+市町村」・・・都市
  • 「緯度経度」・・・緯度、経度

を選択します。

f:id:kan1arino:20210326203540p:plain

サンプルで指定した「都道府県+市町村」のエリアが塗りつぶされ、マウスカーソルをあわせるとポップアップで該当のデータが表示されます。

f:id:kan1arino:20210326203654p:plain

Point5. 複数ページのレイアウトをそろえられる

データポータルはデータの視覚化に優れており、日々確認する「ダッシュボード」として利用する人が多いかと思います。 それに加え、あたかもPowerPointで作った資料のようにデザイン・レイアウトを行い、PDFで出力して月次の共有資料とすることも可能です。

そんな時に使えるのが「レポートレベル」の機能。本来「レポートレベル」の機能は、各ページに共通した図や表などのコンポーネントを共通管理するためのもの。 本機能では、透明の図形画像をおき、レポートレベル に設定することで、すべてのページに反映する仮想的な”グリッド”を設定できます。これにより、ページを越えて、レイアウトを揃えられます。

f:id:kan1arino:20210326203743p:plain

Point6. テキストを柔軟に扱える

データポータルで運用すると、レポートが決まったフォーマットに定型化できます。 定型化は、作業者や閲覧者の負担を軽くするメリットがありますが、一方で柔軟性が少なくなります。 例えば、今月のデータではこうであったのように文字としてのサマリを残しておきたい場合や、毎月ひとことを追加することでレポートの行間を埋めることを行いたい、そんな場合には、テキストそのものをデータとして管理し、条件に合わせて表示することができます。

同時に、テキストの管理をスプレッドシートで行うことで修正・変更を柔軟にし、管理権限もスプレッドシートに任せることができるメリットもあります。

例として、月別のサマリを表示してみましょう。 スプレッドシートのA列には日付、B列にはテキストを用意します。

f:id:kan1arino:20210326204008p:plain

選択する期間設定で表示するテキストをコントロールできます。 テキストの表示は、「表」のみで、「ヘッダの表示」 をオフ、「テキストの折り返す」 をオン 「行番号の表示」 をオフ、「ページ設定を表示」 をオフにすると、表の枠などを非表示にできます。

日付データを持つことで期間設定のフィルタで表示をコントロールできます。 f:id:kan1arino:20210326204108g:plain

Point7. 無償で大容量のデータを扱える

データポータルでダッシュボードを作る際、スプレッドシートにインポートしたデータを利用する人が多いと思います。しかし、スプレッドシートのファイル容量上限は最大256 列、最大 200,000 セルとなっており、これを超えるデータはデータポータルでも扱えなくなってしまいます。 しかし、データポータル自体は100MBを上限にCSVファイルをアップロードし利用できるのです。スプレッドシートを経由せず、ファイルを直接アップロードすれば、大容量のデータも利用可能です。(しかも無償!)

f:id:kan1arino:20210326205428p:plain

1ファイル100MB、1つの領域で合計100MBの条件はありますが、スプレッドシートでインポートできないデータを利用できるので覚えておいて損はないでしょう。

参考:CSV ファイルをデータポータルにアップロードする - データポータルのヘルプ

最後に

以上、7つを紹介しました。

記事を分析する際、どうしてもPVだけで評価されることが多いかと思います。 今回ご紹介したようなtipsを使うことで、PV指標だけではなく、他の指標も用いて多面的に記事が評価できるのも、データポータルの利点です。

例えば、SmartNewsが提供するdeep insightsでは、5秒以内にページから離れた割合(BR=BounceRate)を計測しているので、これをデータポータルで表現することで、ページビューとBRをかけ合わせた”正味の"PVを可視化することができます。Google Analyticsでは同様の指標がないので、直帰率が高く、平均ページ滞在時間が少ないページを把握してもよいでしょう。

PVだけの単体指標では、クリックだけで稼いだPVも評価されてしまうため、さまざまな指標と組み合わせ、自社でのPV価値を定義することの参考になれば幸いです。

著者紹介

有野 寛一(ありの・ひろかず)

有野 寛一

スマートニュース株式会社 メディア事業開発

前職ではSmartNewsAwardsを受賞した週刊アスキーのWebプロデューサー。その知見を活かした媒体社様とのコミュニケーションを担当する。大手ポータル、SNSでの経験から情報発信と受信に課題を持ち現職へ。インターネットで流通するニュースが好き。

この記事も書きました。

www.mediatechnology.jp

www.mediatechnology.jp

www.mediatechnology.jp

*1:※「ページ」にはURLが該当するフィールドを選択してください。

*2:※表示されているデータは本サンプルを作成するにあたり生成したダミーデータです。