
新規ユーザー数はサイトの重要な指標になっているケースも多いと思います。しかし、実は少しクセがある指標なので、実際にGA4のレポートで利用してみると「思っていたのと違うな?」という数字が出る可能性があります。
新規ユーザー数を見たい時にもし躓いたら、このコラムがヒントになると幸いです。
- そもそも新規ユーザー数はどうやって出しているの?
- 新規ユーザー数と「イベント名」の組み合わせは注意
- 新規ユーザー数とページ系のディメンションの組み合わせは注意!
- じゃあどうやってデータを見ればいいの?
- 新規ユーザー数の方が総ユーザー数より多いのはなぜ?
そもそも新規ユーザー数はどうやって出しているの?
データを使う時に、そのデータがどのように作られているかを理解するのはとても重要です。
GA4のディメンションや指標がどうやって計測・計算されているか、公式ヘルプで定義を見てみましょう。
公式ヘルプ:[GA4] アナリティクスのディメンションと指標

ユーザーがサイトに初めて訪問したときにfirst_visitイベントが、アプリの場合はfirst_openイベントが自動で計測されます。
このfirst_visitまたはfirst_openが計測されたユーザーの数(ユーザーIDの数)を数えているのが「新規ユーザー数」という指標です。
新規ユーザー数と「イベント名」の組み合わせは注意
「このボタンをクリックした新規ユーザー数」「新規ユーザーが検索したサイト内検索キーワード」のようなデータを出すためにイベント名やイベントで計測しているカスタムディメンションと組み合わせよう、というのができません。
新規ユーザー数がカウントされるのは、「新規ユーザー数」の材料になるfirst_visitイベントのみだからです。

そのため、first_visitイベント以外のイベントで作られるデータと組み合わせるとすべて0件になってしまいます。

新規ユーザー数とページ系のディメンションの組み合わせは注意!
前述のイベントと考え方は同じですが、「新規ユーザー数」の材料になるfirst_visitイベント以外のイベントの情報に新規ユーザー数がカウントされません。
ページ系のディメンションに、さらにイベント名をかけあわせるとわかりますが、first_visitイベントのパラメータとして計測されたもののみに「新規ユーザー数」がカウントされています。

ページ系と組み合わせる場合、単に「新規ユーザーが閲覧したページはどれが多い?」というデータが見たい場合がほとんどだと思いますが、集計されているのは「ユーザーがサイトに来た一番最初に見たページはどれが多い?」というデータです。
誤解を招きやすいので、「ページタイトル」「ページパス」などのページ系のディメンションと新規ユーザー数を組み合わせて見るのはあまりおすすめできません。
じゃあどうやってデータを見ればいいの?
新規ユーザーのサイト内行動を確認したい場合、セグメントの利用を推奨します。

データを「新規」と「既存」に切り分けて見たい場合、だいたいは「初めてサイトに来たとき」と「2回目以降にサイトに来たとき」の行動の違いを見るのが目的です。
その場合、指標として用意されているのは新規”ユーザー”ですが、セグメントとしては新規”セッション”として作成すると良いでしょう。

新規セッション、リピートセッションを絞り込むセグメントの作り方の詳細については、以下のコラムで説明しています。
[GA4]セグメント:初回セッションとリピートセッション(新規とリピーター)
もちろん「集計期間中に初めてサイトに来たユーザーの全ての行動」を見るのが目的であれば、ユーザースコープのセグメントが必要になります。
たとえばサイトリニューアル前後で「旧サイトにも来ていたユーザー」と「新しいサイトから使い始めたユーザー」のようにデータを切り分けたい場合はユーザースコープで見るのが適している場合もあります。
集計目的に応じて、セグメントをうまく使い分けましょう。
新規ユーザー数の方が総ユーザー数より多いのはなぜ?
レポートによっては、新規ユーザー数の方が総ユーザー数より多い、という事象が見られます。
サイトの実装状況などにもよりますが、要因として大きく考えられるのは機械学習です。
語弊がある表現かもしれませんが、GA4のレポート画面は、実際に計測されたデータを正確に表示しているものではありません。
GA4のレポートに表示される一部のデータでは、機械学習によって推定された値が表示されます。内容としては以下の2パターンです。
❶GA4の処理負担を軽減化してレポートのパフォーマンスを向上するために導入されているもの。こちらは利用者がオンオフを切り替えることはできませんので絶対に反映されます。適用されないデータを確認するためにはBigQueryを使って自分で集計する必要があります。
公式デベロッパードキュメント:Google アナリティクスにおけるユニーク カウントの近似値
❷Cookie取得が難しい場合に機械学習によってデータを補完するために導入されているもの。こちらは管理画面の「レポートID」を「計測データ」か「デバイスベース」にすることで反映しないように設定できます。
公式ヘルプ:[GA4] 同意モードの行動モデリング
今回の例で言うと、「総ユーザー数」は推定された近似値であり、厳密に計測された数をカウントしただけのデータではありません。
一方で「新規ユーザー数」はfirst_visitイベントのログを利用して、計測された数をカウントした計測値のみのデータです。
そのため、アルゴリズムによる結果によってはわずかな誤差が生じて新規ユーザー数の方が総ユーザー数より多いという事象が発生しうるのです。
指標ごとに近似値なのか実際のデータなのかという情報は公開されていませんので、「なんか数値が変だな?」と思ったら一度BigQueryで集計しなおしてみると結果が変わる可能性があります(LookerStudioのGA4コネクタを利用してデータを見ている場合も、APIに同仕様が適用されるのでBigQueryで見る必要があります)。
さいごに
GA4は自分で自由に集計できる分、正しい仕様を知っていないと「思っていた数値と違う」という結果がでてしまうことが多くあります。
不思議に思ったらBigQueryで集計したり、他のディメンションをかけ合わせて見ることで解決できるケースもありますが、今後もっとわかりやすく使えるツールになっていくといいですね。




