リファラスパムとは?Googleアナリティクスで除外する3つの方法!

Googleアナリティクスでデータを見ていて、見慣れないURLを見かけたことはないでしょうか?もしかしたら、それはリファラスパムかもしれません。
ただ、「そもそもリファラスパムって何?」「どうやってリファラスパムを除外すれば良いの?」そういった方も多いでしょう。
そこで今回はそういった方へ向けて、リファラスパムの概要と、リファラスパムの除外方法について詳しく解説していきます。
この記事を読めばリファラスパムについての理解が深まり、Googleアナリティクスのデータからリファラスパムを除外することができます。
リファラスパムとは?仕組みと手口
「リファラスパム」とは、Googleアナリティクスで計測されるリファラ(=参照元)を利用したスパムです。
WEBサイトの運営者であれば、ユーザーがどのページから流入したのかを日常的に調べると思います。
その際に、見たことのないページからの流入を発見したら、そのページを調べるためにリンクをクリックするかもしれません。
これが、リファラースパムの手口です。
意図的にGoogleアナリティクスにリファラーを残すことで、WEBサイトの運営者をスパムサイトに誘導します。
スパムサイトにアクセスすると、ウイルスに感染してしまう恐れがあるので絶対にクリックしないでください。
リファラスパムが増えることの問題点
リファラスパムが増えることの問題点として、まず挙げられるのはスパム自体の脅威です。
具体的には、以下のような被害を受ける可能性があります。
- ウイルスに感染する
 - 金銭を騙し取られる
 - 情報を抜き取られる
 - 不要な広告を見せられる など
 
リファラースパムによって送られる参照元は、ユーザーを騙すための悪意のあるページです。
アクセスしてメリットになることは一つもありません。
もう一つのリファラスパムが増える問題点は。WEBサイトへのアクセスを正確に計測できなくなるということです。
上記の問題はアクセスしなければ回避できますが、こちらの問題はそういうわけにはいきません。
リファラスパムが増えることによってアクセス数が量増しされ、数字上のアクセスだけが増えてしまいます。
もちろん、スパムによる悪意のあるアクセスなので、コンバージョンなどに寄与することはありません。
リファラスパムは放置しているだけでWEBサイトにとって害になるので、できるだけ早めに対処することが必要です。
Googleアナリティクスでリファラスパムを確認する方法
Googleアナリティクスでリファラースパムを確認する方法としては、主に以下の2とおりが挙げられます。
- ドメイン名からリファラスパムを判断する
 - 自社サイトではないホスト名に注目する
 
前者は直感的で簡易的な方法ですが、リファラスパムが少ない場合には十分こちらで対応可能です。
リファラースパムが多い場合には、後者の方法も検討しましょう。
ドメイン名からリファラスパムを判断する
リファラスパムは、比較的判断しやすくドメイン名を見れば、おおよその検討はつきます。
Googleアナリティクスのホーム画面を開いて、以下のように進んでください。
[レポート]→[集客]→[全てのトラフィック]→[参照元/メディア]

ここでリファラの情報を確認できますが、今までに見たことのない怪しいURLがあればリファラスパムの可能性があります。
特に海外サイトであれば、リファラスパムの可能性はかなり高いといって良いでしょう。
なぜなら、海外サイトから、日本語で書かれた日本人向けのサイトを訪れるケースはほとんどないからです。
そういったURLを発見したら、リンクをクリックして直接アクセスすることは控えてください。
自社サイトではないホスト名に注目する
リファラスパムを見分けるもう一つの方法は、自社サイトではないホスト名に注目するということです。
リファラのホスト名は、Googleアナリティクスホームから以下の手順で確認できます。
[レポート]→[ユーザー]→[テクノロジー]→[ネットワーク]→[ホスト名]

このレポートで、計測対象としているドメイン名以外が表示されている場合、リファラスパムの可能性があります。
なぜなら、Googleアナリティクスにデータを送信するのは、通常、計測対象のドメインしかあり得ないからです。
リファラースパムは、サイトを経由せずGoogleアナリティクスに直接データを送信する場合があるので、ホスト名が異なります。
こちらも発見した場合、直接アクセスすることは控えてください。
Googleアナリティクスでリファラスパムを除外する方法
WEBサイトにリファラスパムが発見されたら、リファラスパムを除外する設定を行いましょう。
リファラスパムの除外方法は、主に以下の3とおりです。
- ボットフィルタリングを利用する
 - セグメントで絞り込む
 - フィルタを設定する
 
それぞれ使用するケースと効果が異なりますので、ケースバイケースで除外方法を選択してください。
ボットフィルタリングを利用する
ボットフィルタリングは、既知のボットやスパイダーからのアクセスを全て除外する設定です。
Googleアナリティクスのホームから、以下のように進みます。
[管理]→[ビュー]→[ビューの設定]

上記の画面を開いたら、「ボットのフィルタリング」にチェックを入れた後、[保存]を押せば設定は完了です。
セグメントで絞り込む
今までに取得したデータからリファラスパムを除外する際には、セグメントで絞り込む方法が有効です。
例えば、「ユーザーサマリー」のデータからリファラスパムを除外する場合は、以下のような操作を行います。

[すべてのユーザー]→[新しいセグメント]→[条件]
上の画面を開いたら、以下のように条件を設定します。
- フィルタ:ホスト名
 - セッション:含む
 - 含める:自サイトのドメイン
 - セグメント名:任意(例:リファラスパム除外)
 
以上を設定して[保存]をクリックすれば、ホスト名の異なるリファラスパムのデータを除外することができます。
フィルタを設定する
今後取得するデータからリファラスパムを除外したい場合は、フィルタの設置を行うのが効果的です。
Googleアナリティクスホームから、以下のように進みます。
[管理]→[アカウント]→[すべてのフィルタ]→[フィルタを追加]

上記の画面が表示されたら、フィルタ情報を以下のとおりに入力してください。
- フィルタ名:任意(例:リファラスパム①)
 - フィルタの種類:カスタム
 - フィルタフィールド:参照
 - フィルタパターン:リファラスパムのURL
 - 使用可能なビュー:すべてのウェブサイトのデータ
 
以上を入力したら、[保存]を押して設定は完了です。
まとめ:Googleアナリティクスでリファラスパムを除外しよう

今回は、リファラスパムの概要と、リファラスパムの除外方法について解説しました。
本記事の要点は、以下のとおりです。
- リファラスパムはWEBサイト運営者にとって害になると同時に、正確なデータの計測を妨げる
 - リファラスパムは、ドメイン名やホスト名などから比較的容易に判断することができる
 - Googleアナリティクスのセグメント機能やフィルタ設定を利用して、リファラスパムを除外する
 
この記事を参考にリファラスパムについての理解を深め、Googleアナリティクスのデータからリファラスパムを除外しましょう。
運営者や関係者のアクセスを除外したい場合は、以下の記事を参考にしてください。
このページの監修者
                Hiroaki Onodera
                      静岡でWEB制作&コンサルティング会社を経営しています。
全国の制作会社様からコーディングやWordPress実装の仕事をお引き受けしています。