例えば、GA4で「参照元」「メディア」「キャンペーン」関連のディメンションで、下記のような複数の指標が出てきます。
これらの違いを理解している方は少ないのではないかと思います。
■参照元 / メディア関連
「セッションの参照元 / メディア」
「参照元 / メディア」
「ユーザーの最初の参照元 / メディア」

APIでデータ出力した際に「エラーが出ていないから大丈夫」と思い込んでしまうと、後々の分析も間違ったものになってしまいます。時間をかけて分析したけど、本当はデータ量が不足していて間違ったまま報告を行って後から大目玉をくらうケースは避けないといけません。
このような問題を避けるために、弊社ではそれぞれの指標を変えてどのように出力データの内容が異なるか、「セッション」「ユーザー」「コンバージョン」の合計値を比較して検証してみました。
その結果をまとめた内容をご紹介します。
「セッションの参照元 / メディア」と「参照元/メディア」
まず①「セッションの参照元/メディア」②「参照元/メディア」で、出力データに違いがあるのか確認してみました。
GA4のデータ出力には、ツールを使ってAPI経由で下記のようにスプレッドシートへ集計しました(Google Apps Scriptではありません)。
指標については、それぞれ下記の「イベント名」の横に表示される指標の合計を算出しています。
「セッション」「合計ユーザー」→「session_start」
「コンバージョン」→「purchase」

出力結果をまとめると、下記の表のとおりです。
| ディメンション | イベント数 | セッション | コンバージョン |
|---|---|---|---|
| ①セッションの参照元/メディア | 126446 | 128830 | 1897 |
| ②参照元/メディア | Error | Blank | 1897 |
Blank→イベント名の出力が限定されて、そのデータは出力されなかった(エラーは出ないがデータ量が少ない)
「コンバージョン」は①,②で同じ集計値となったものの、「イベント数」「セッション」は②「参照元/メディア」をディメンションに含めた時は出力されませんでした(省略されている)。
事前にイベント数を設定してエラーが出て「これではダメだ」と気づけばまだ良いですが、イベント名を良く見ないで「セッション」の合計が流入数だと思ったらそれは間違いです(イベント名「purchase」の横に表示される「セッション」は、実際の「コンバージョン」に近い数値であって流入数とは違う)。
ここはUAと同じ感覚で考えていると、間違いやすいところでしょう。
「ユーザーの最初の参照元 / メディア」と「参照元/メディア」
次に②「参照元/メディア」、③「ユーザーの最初の参照元/メディア」で比較しました。
出力結果をまとめると、下記の表のとおりです。
| ディメンション | イベント数 | 合計ユーザー数 | コンバージョン |
|---|---|---|---|
| ②参照元/メディア | Error | Blank | 1641 |
| ③ユーザーの最初の参照元/メディア | 124812 | 103419 | 1264 |
「イベント数」「合計ユーザー数」が「Error」「Blank」で集計できないのは先ほどのセッション系の結果と同じですが、「コンバージョン」の数値も違っています。
この「コンバージョン」のずれが、他のGA4アカウントでも再現性があるかどうか確認できていないですが、どちらにしても「参照元/メディア」で「セッションの」「ユーザーの最初の」が付かないディメンション名は使わないほうが良いということが言えそうです。
「セッションのキャンペーン」と「キャンペーン」
今度は「キャンペーン」です。広告で流入状況をGA4で見たい方が良く使うディメンションでしょう。
媒体側だけでなく、GA4側でサイト内の流入やコンバージョン状況が分かります。
④「セッションのキャンペーン」と⑤「キャンペーン」で比較すると、下記の結果になりました。
| ディメンション | イベント数 | セッション | コンバージョン |
|---|---|---|---|
| ④セッションのキャンペーン | 126446 | 127272 | 1897 |
| ⑤キャンペーン | Error | Blank | 1897 |
「コンバージョン」については、先程の「セッションの参照元/メディア」と一緒です。
合計が一致しているので、データの欠落はないと考えて大丈夫です。
一方、「セッション」については、「セッションのキャンペーン」では「セッションの参照元/メディア」とほぼ同じ「イベント数」「セッション」となったので正常と考えて大丈夫ですが、「キャンペーン」というディメンション名は使わないほうが良いと分かりました。
「ユーザーの最初のキャンペーン」と「キャンペーン」
最後に⑤「キャンペーン」と⑥「ユーザーの最初のキャンペーン」の比較です。
| ディメンション | イベント数 | 合計ユーザー数 | コンバージョン |
|---|---|---|---|
| ⑤キャンペーン | Error | Blank | 1862 |
| ⑥ユーザーの最初のキャンペーン | 125878 | 103702 | 1596 |
今までと同様の傾向が出ており、「キャンペーン」では「コンバージョン」以外の指標が正常に表示されないようです。 このことからも「ユーザーの最初のキャンペーン」のほうを使うべきだと分かります。
まとめ
このように、「参照元/メディア」「キャンペーン」では、「セッションの」「ユーザーの最初の」が付いたディメンション名を使う必要があることが分かりました。他にもGA4の指標でエラーが出たり、対象のイベント名でデータが省略されていたりすることがあるでしょう。
このようなGA4の似た指標に対する理解を深めて、それぞれ集計値がどれくらい違うか確認したうえで活用することが望ましいです。
GA4はこれからも機能が発展していくと思いますが、データ集計は複雑な作業であり注意が必要です。
ディメンションや指標に対する理解を深める際に、本記事が少しでも参考になれば幸いです。


