最終更新日

公開日

【未解決】GA4のリファラースパムで根治療法を発見できませんでした

【未解決】GA4のリファラースパムで根治療法を発見できませんでした

弊社クライアントの株式会社日本コネクト様が、台湾の電子機器メーカー『デルタ電子』と、”戦略的パートナーとして協力することを決めた”と地元経済誌に取り上げられました。

デルタ電子が台湾大手半導体メーカーの日本法人第一工場建設にてバックアップ電源(UPS設備)や一部のセキュリティ関係の工事に携わり新規案件も着手する予定であることから、人材確保と九州での拠点設置が急務となったため今回戦略的パートナーとして協力することを決めた。また日本コネクトの電気通信工事事業はデルタ電子が引き継ぐ。

出典:くまもと経済新聞 石原1丁目の日本コネクト本社屋に九州営業所・・・・デルタ電子

デルタ電子は記事にあるよう『TSMC』の案件を請け負う企業です。であれば、世界中の企業から注目されてもおかしくないのではないか、日本コネクト様のホームページも海外からのアクセスが増加しているはずだ。そう仮説を立て、GA4の画面を開いてみました。

不可解なデータを発見しました

標準レポートからユーザー属性と進み、『国』のディメンションで確認してみると、驚くべきことに「Japan」以外の国が並んでいました。仮説は当たったと思い、いつからこの状況なのかと計測期間を一年間に広げてみると、デルタ電子との接点がある以前から海外のアクセスが確認できました。

そんなに前から注目されていたのかと少し不思議に思いながら、次に、海外ユーザーがどこから来ているのかと思い、探索レポートで国と参照元 / メディアを掛け合わせてみました。

すると、国には外国名、参照元 / メディアには見たことのない参照元が referral で、そしてどのデータもエンゲージメントが0で計測されていました。

かつて、旧Googleアナリティクスの時にも見たこの不可解なデータ。これは「リファラースパム」なのではないか、であればきっと他のサイトでも同じ現象が発生しているはずです。調査し対策する必要があります。他のサイトでも

  • 海外からのアクセスが
  • 参照元 / メディアで見慣れない参照元が referral で
  • エンゲージメントの数値が 0

のデータが計測されていないか探索レポートを使い調査してみました。

どうして不可解なデータなのか?

1 のデータをピンクで強調しています。このタイプのデータが多く計測されています。データの特徴はユーザー数とセッションの数値が同じ、エンゲージメントの数値が0という点です。

GA4ユーザーの動きをすべて「イベント」として計測します。そのためユーザー数とセッションよりイベント数が多くなるのはわかります。イベントが多いということは、ページ内でクリックやスクロールなど何かしら動作があったということです。にも関わらずエンゲージメントが0ということは大変不可解です。

このエンゲージメントととはGA4になり登場してきた指標です。英語の Engagement は文脈によって様々な意味を持つ言葉で、「婚約」 や「約束」といった意味を持ちます。昨今ではビジネスシーンでよく使われるようになり「顧客エンゲージメント」という風に企業と顧客との信頼関係や繋がりを表す言葉として使われます。

GA4における「エンゲージメント」の定義は

サイトやアプリに対するユーザーの操作です。

出典:アナリティクスヘルプ https://support.google.com/analytics/answer/9355853

となっています。つまり、ウェブサイトにおけるユーザーの「積極的な関与」を意味します。

では、上記の探索レポートで使われている指標「エンゲージのあったセッション数」はどういった意味かといいますと、

  • セッションとは、ユーザーがウェブサイトまたはアプリを操作している間のことです。
  • エンゲージメント セッションとは、次のいずれかの条件を満たすセッションを指します。
  • 10 秒以上継続する
  • キーイベントが発生する
  • ページビューまたはスクリーン ビューが 2 回以上発生する
 出典:アナリティクスヘルプ https://support.google.com/analytics/answer/12195621

となっていて、どれか1つ該当すればエンゲージメントが発生したことになります。

また1のデータの話しに戻りますが、171のセッションがあり684もイベントが発生しているにもかかわらず1度も10秒以上サイトに滞在していなかったというのは、どう考えてもおかしな現象だと思います。

こういったおかしなアクセスを発生させ、この参照元は何だと思わせアクセスさせることが目的のリファラースパムではないかと推測されます。

リファラースパムとは

リファラースパムとは一体何なのでしょうか。

例えば、先程の1のデータは「news.grets.store / referral」というトラフィックが計測されています。これは「news.grets.store」 というドメインに自社サイトのリンクが何らかの形で掲載してあり、そのリンク経由でアクセスしてくれたというデータです。

そうなると、やはりサイト運営者としては news.grets.store のことを調べるためにこちらからアクセスしてしまうものです。参照元ドメインへ誘導することが目的であったり、最悪な場合ページにウィルスなどが仕込まれていることもあります。

こういった、悪意を持って参照元情報を残す行為が「リファラースパム」です。リファラースパムは旧Googleアナリティクスのころから存在していました。

いつからリファラースパムは出現したのか?

Googleトレンドで調べてみると、旧Googleアナリティクスのころの2016年がピークでした。2022年以降また少しずつ話題にはなっているようです。

Googleトレンドでリファラースパムを調査した結果

リファラースパムの作り方(仮説)

一体どのようにしてこのリファラースパムは作られているのでしょうか。旧Googleアナリティクスの頃には「Measurement Protocol」を利用して生成されていると考えられていました。

Measurement Protocol とはGoogleアナリティクスのサーバーに直接データを送るための仕組みで、一定の形式を満たしていればGoogleアナリティクスのサーバーにデータを送信できます。これを利用すればサイトにアクセスするだけでなく、メールの開封やIoTの解析にまで使えるという非常に便利な計測機能です。

リファラースパムを作り出している悪徳業者は、またこの機能を利用し機械的にデータを送りつけているのではないでしょうか。その仮設が正しいのであれば、サイトにアクセスすることなくデータを送りつけているということになります。となると、エンゲージメントがまったく発生しないということも合点がいきます。

未解決 リファラースパムを防ぐ方法

では、どうすればこのリファラースパムを防ぐことができるのでしょうか。

旧Googleアナリティクスの時の対処法

旧Googleアナリティクスの時は『ホスト名』でフィルターを作れば根治治療ができていました。ホスト名とは計測対象のドメインのことです。複数ドメインを同一のGA4で計測している際に使用するディメンションです。計測対象が自社サイト一つの場合、もちろん自社ドメインしか計測されません。ところがここに自社ドメイン以外が計測されていたのです。そのため自社ドメイン以外をブロックするようにすれば解決していました。

GA4ではどうなのかと思い、 先程の探索レポートに「ホスト名」を追加したところ、なんと「自社サイト」のドメインが計測されていました。悪徳業者も対策をしていたのです。

GA4での根本的な対応方法は見つけられませんでした

すぐに思いつく方法としては、「除外する参照のリスト」にリファラースパムのドメインを追加する対処が挙げられます。具体的な設定方法については、他のサイトで詳しく解説されています。『GA4 リファラースパム対策』などで検索してみてください。

しかし、これは一時的な対応に過ぎず、新たなスパムが現れるたびにリスト更新が必要となり、根本的な解決には至りません。とはいえ、悪質なデータを放置するわけにもいかないため、現状ではこの対処療法を行いながら、今後も恒久的な対策を模索していきたいと思います。

ホームページのお悩みは『ホームページリニューアルのプロ』にご相談ください。

旗印株式会社はホームページリニューアルで結果を出してきました。ホームページ経由でお問い合わせがなかなか来ないなど、お悩みがありましたらお気軽にご相談ください。

この記事の著者

岡本明のx

岡本 明(おかもと あきら)

旗印株式会社の代表取締役です。2006年にプログラマとして就職し、2017 年に独立、 2023 年に法人化しました。ヒアリングにはじまりマーケティング戦略とそれを実施するためのご提案、施策実行のマネジメント、運用後のサポートを行っています。

関連記事

メニュー 閉じる