Как исправить спам рефералов в Google Analytics

 Как исправить спам рефералов в Google Analytics

Patrick Harvey

Вы получаете много реферального спама в Google Analytics? Вы беспокоитесь, что ваши отчеты могут быть испорчены им, но не совсем уверены?

В этой статье мы рассмотрим несколько различных методов, которые вы можете использовать для блокировки реферального спама в ваших отчетах. В основном мы сосредоточимся на достижении этой цели с помощью одного фильтра.

Во-первых, давайте поговорим о том, что такое реферальный спам и почему его нужно избегать.

Что такое реферальный спам?

Реферальный трафик, также известный как "хит", - это трафик, который не исходит от поисковых систем (органический трафик) или пользователей, посещающих ваш сайт, введя его домен в адресную строку (прямой трафик).

Примерами реферального трафика являются трафик, отправленный с сайтов социальных сетей или с другого сайта, ссылающегося на ваш.

Хиты регистрируются, когда пользователи взаимодействуют с вашим сайтом, но в основном они происходят от посещений. В Google Analytics хиты регистрируются как просмотры страниц, события, транзакции и т.д. Реферальный спам генерирует фальшивые хиты, которые в основном происходят от ботов или поддельных сайтов.

Каждый сайт с аккаунтом Google Analytics имеет собственный код отслеживания, который идентифицирует его. Поэтому вам необходимо добавить скрипт Google Analytics в файлы вашего сайта, чтобы сервис регистрировал данные о трафике и поведении пользователей на вашем сайте. Этот код обычно размещается в заголовке, хотя гораздо проще добавить его с помощью плагина.

Когда законный пользователь посещает ваш сайт, данные проходят через ваш сервер, а затем передаются в Google Analytics.

Когда возникает распространенная форма реферального спама, известная как "спам-призрак", злоумышленники используют автоматизированные скрипты для отправки поддельного трафика на случайные коды отслеживания Google Analytics Когда эти фальшивые хиты отправляются в ваш код, данные регистрируются в вашей аналитике как результат, несмотря на то, что трафик никогда не достигал вашего сайта.

Иногда фальшивые рефералы приходят от вредоносных краулеров. Трафик, отправленный через этот тип реферального спама делает проходит через ваш сервер, но при этом игнорирует правила файла robots.txt вашего сайта. Затем трафик передается в Google Analytics и регистрируется как хит.

Как обнаружить реферальный спам в Google Analytics

Вы можете найти реферальный спам наряду с другими рефералами, которые Google Analytics регистрирует для вашего сайта. Вы найдете их, перейдя в раздел Acquisition → All Traffic → Referrals.

Некоторые спам-сайты легко обнаружить. Обычно они имеют странные домены с непрофессиональными названиями, фразы типа "зарабатывайте деньги" или ссылки на материалы для взрослых.

Они также могут содержать много дефисов или использовать нестандартные расширения домена. Другие спам-рефералы не так легко обнаружить, поэтому вам придется использовать альтернативные методы.

Кстати, убедитесь, что вы используете пользовательский диапазон при просмотре ваших рефералов в Google Analytics. Настройте его на просмотр последних двух месяцев, но вы можете вернуться как угодно далеко назад. Только учтите, что чем дальше вы вернетесь назад, тем больше данных вам придется просеять.

Поскольку попадания в виде спама-призрака не исходят с реального сервера вашего сайта, они обычно имеют показатель отказов 100% и продолжительность сеансов 0 минут и 0 секунд. Щелкните на колонке Показатель отказов, чтобы отсортировать данные по наибольшему показателю отказов, чтобы облегчить себе работу.

Спам с помощью краулеров обнаружить гораздо сложнее, поскольку эти боты сделать посещают ваш сайт, поэтому они обычно используют достоверные URL-адреса и имеют точные данные об отказе и сессии. Если вам кажется, что URL-адрес источника в ваших отчетах о рефералах является спамом, не посещайте сайт, чтобы подтвердить это.

Вместо этого запустите его через поиск Google, заключив его в кавычки ("google.com", например), чтобы узнать, не сообщалось ли о нем как о спаме.

Если вы посещаете эти сайты, убедитесь, что вы используете последние версии браузеров, таких как Chrome и Firefox, в которых предусмотрены меры защиты от вредоносных сайтов. Убедитесь, что на вашем компьютере или устройстве также установлено и активно антивирусное программное обеспечение.

Почему реферальный спам - это плохо?

Отчет "Рефералы" - не единственное место, куда просачиваются данные от реферального спама в Google Analytics. Вы найдете их во всех отчетах, особенно в главном представлении, где находится общее количество просмотров вашего сайта или отдельных страниц.

Если в ваши отчеты попадают данные, не отражающие реальных людей, вы можете принять неверные маркетинговые решения, которые приведут к тому, что кампании либо не взлетят, либо не принесут дохода.

Следует отметить, что хотя Google сделал многое, чтобы предотвратить влияние реферального спама на ваши данные, это распространенное явление, которое затрагивает большинство сайтов в Интернете.

Смотрите также: 7 лучших альтернатив OptinMonster на 2023 год

Хотя вы всегда должны выбирать качественный хостинг, использовать плагин безопасности, если вы не используете управляемый хостинг WordPress, и устанавливать темы и плагины только из надежных источников, вы не сможете сделать много для борьбы со спамом, поскольку они либо не атакуют ваш сайт напрямую, либо имеют способы придать трафику законный вид.

Именно поэтому мы собираемся показать вам, как устранить реферальный спам, фильтруя его в Google Analytics.

Как исправить реферальный спам в Google Analytics

Фильтры в Google Analytics являются постоянными, и отфильтрованные данные не могут быть восстановлены. Вот почему вы всегда должны создавать нефильтрованное представление для своего сайта, поскольку оно позволяет увидеть данные, которые, возможно, были неправильно отфильтрованы. Это поможет вам отслеживать количество спама, получаемого вашим сайтом, даже после применения фильтров для его удаления.

Создать нефильтрованное представление для аккаунта Analytics вашего сайта очень просто. Начните с экрана администратора (кнопка Admin расположена в левом нижнем углу) и нажмите View Settings на панели View (правая панель).

Начните с переименования текущего представления, которое по умолчанию называется "Все данные веб-сайта", в "Главное представление", изменив имя в поле View Name (Имя представления). Нажмите Save (Сохранить).

Если вы прокрутите страницу назад до самого верха, вы увидите кнопку в правой верхней части экрана с надписью "Копировать вид". Нажмите ее, назовите новый вид "Нефильтрованный вид" и нажмите кнопку Копировать вид для подтверждения.

Вы также можете вернуться к представлению Master View и повторить этот процесс для создания другого представления под названием "Test View". Вы можете использовать это представление для тестирования новых фильтров, прежде чем применять их к главному представлению.

Теперь у вас есть нефильтрованное и, возможно, тестовое представление в Google Analytics. Если вы применяли фильтры к основному представлению, удалите их из нефильтрованного и тестового представлений. Если вы этого не делали, вы получите от Google Analytics уведомление об избыточных представлениях, которое можно смело игнорировать.

Устранение спама от рефералов-призраков с помощью одного фильтра

Вы уже определили спам-адреса в отчетах о рефералах. Многие веб-мастера идут дальше и создают фильтры, блокирующие появление этих URL в отчетах.

К сожалению, спамеры редко используют одно имя источника в своих атаках, что означает, что вам придется постоянно создавать новые фильтры, чтобы блокировать любой последующий спам, который появляется в ваших отчетах.

Вместо этого следует создать фильтр, который будет включать данные только от реальных имен хостов.

За каждым доменом стоит компьютер и сеть, к которой он подключен, и которые можно определить по IP-адресу. Этим IP-адресам присваиваются уникальные "имена хостов", чтобы идентифицировать их с помощью легко запоминающихся буквенно-цифровых имен.

Префикс "www" является именем хоста, как и каждый домен в Интернете, поскольку они оба связаны с компьютерами или сетями с IP-адресами.

Призрачный спам отправляется на случайные коды отслеживания Google Analytics, а не на хосты, связанные с вашим сайтом, поэтому вместо них используются поддельные имена хостов. Это означает, что гораздо эффективнее отфильтровывать рефералов, использующих поддельные имена хостов.

Фильтр, который мы собираемся создать, также удалит поддельные хиты, созданные поддельными именами хостов в ваших отчетах по ключевым словам, просмотрам страниц и прямому трафику.

Создание регулярного выражения для фильтра

Мы собираемся создать фильтр, который будет включать только хиты с действительных имен хостов, чтобы исключить поддельные. Это означает, что вам нужно создать список действительных имен хостов, связанных с вашим сайтом.

Если к основному представлению применены фильтры, переключитесь на нефильтрованное представление, которое вы создали ранее. Вы найдете имена хостов, идентифицированные Google Analytics, перейдя в раздел Аудитория → Технология → Сеть и переключив основное измерение на Имя хоста.

Вот список типов имен хостов, которые вы захотите включить в свои отчеты:

  • Домен - Это основное имя хоста, используемое для идентификации вашего сайта в Интернете, через которое будут проходить законные рефералы, поэтому оно должно быть включено. Вы можете игнорировать любые созданные вами поддомены, поскольку они будут покрыты вашим основным доменом.
  • Инструменты и услуги - Это инструменты, которые вы используете на своем сайте и, возможно, связали с вашей учетной записью аналитика для сбора данных для кампаний. К ним относятся такие инструменты, как поставщик услуг маркетинга электронной почты, платежные шлюзы, службы перевода и системы бронирования, но внешние инструменты, такие как YouTube, которые вы интегрировали в свою учетную запись, также учитываются.

Составьте список всех допустимых имен хостов, связанных с вашим сайтом, на основе этих советов, убедившись, что каждое имя соответствует тому, как оно выглядит в поле Hostname. Исключите следующие имена хостов:

  • Имена хостов, которые не установлены
  • Среды разработки, например, localhost или поддомен вашей рабочей среды
  • Архивные и скрап-сайты
  • Имена хостов, которые выглядят законными, но являются либо сайтами, которые вам не принадлежат, либо инструментами и сервисами, не интегрированными с вашим аккаунтом Google Analytics. Скорее всего, это спам, замаскированный под законные источники.

Теперь у вас должен быть список действительных имен хостов источников, которыми вы управляете или используете в своем аккаунте Analytics. Теперь вам нужно создать регулярное выражение, или "regex", которое объединит все эти имена.

Регулярное выражение - это специальная текстовая строка для описания шаблона поиска. В данном случае этот шаблон поиска представляет собой список допустимых имен хостов. Google Analytics будет использовать это выражение для определения имен хостов, которые вы хотите включить в свои данные после создания фильтра.

Вот пример того, как должно выглядеть ваше выражение:

 yourdomain.com 

Труба Здесь важны символы OR. Они означают OR и помогают Google Analytics отличать каждое имя хоста друг от друга. Вы никогда не должны вставлять символы pipe в начало или конец выражения, поэтому не начинайте и не заканчивайте ваше регулярное выражение символами .

Создание фильтра

Перейдите на экран администратора и переключитесь на тестовый вид, если он был создан. Если нет, переключитесь на основной вид.

Нажмите ссылку Фильтры в правой колонке Вид, затем нажмите красную кнопку Добавить фильтр. Вот краткий список того, как настроить этот фильтр:

  • Метод: Создайте новый фильтр
  • Имя: Что-то описательное, например, "Действительные имена хостов".
  • Тип фильтра: Пользовательский
    • Убедитесь, что выбран параметр Включить
  • Поле фильтра : Имя хоста
  • Схема фильтрации: Скопируйте и вставьте сюда ваше выражение, не допуская пробелов

После того, как вы вставили свое выражение в поле Filter Pattern, нажмите ссылку Verify This Filter, чтобы проверить, правильно ли будут отфильтрованы нежелательные имена хостов. Нажмите Save, чтобы создать фильтр, когда закончите.

Если все в порядке, повторите процесс с основным представлением и удалите тестовую версию.

Фильтруйте спам от ботов-краулеров

Некоторые спамеры используют гусеничных ботов для отправки поддельных хитов на ваш сайт. Кроме того, некоторые сторонние инструменты, которые вы используете, включая инструменты управления проектами и мониторинга сайта, работают через гусеничных ботов, если они интегрированы в ваш сайт.

Вы можете блокировать этот тип спама, создав аналогичное выражение, но используя имена источников вместо имен хостов. Снова перейдите в Аудитория → Технология → Сеть и добавьте Источник как вторичное измерение.

Вот два различных готовых выражения, которые можно использовать на сайте Карлоса Эскалеры Алонсо, если вы хотите облегчить себе работу.

Выражение 1:

Смотрите также: 13 Статистика времени загрузки страниц веб-сайта (данные за 2023 год)
 семальт 

Выражение 2:

 (artblog 

Вам нужно будет просмотреть исходные URL-адреса, чтобы определить, какие инструменты посылают краулеры на ваш сайт, и создать для них собственное выражение.

Когда вы добавляете эти фильтры в тестовые и основные представления, используйте "Исключить" в качестве типа фильтра и "Источник кампании" в качестве поля фильтра.

Заключительные мысли

Реферальный спам может посеять хаос в аналитике вашего сайта. Он может создать впечатление, что у вас больше просмотров и выше показатель отказов, чем на самом деле. Вот почему важно блокировать реферальный спам в ваших отчетах.

Убедитесь, что у вас есть три разных представления для сайта: одно основное представление, одно для нефильтрованных данных и одно для тестирования. Дважды проверьте область Фильтры для нефильтрованного представления, чтобы убедиться, что их нет, поскольку вам важно отслеживать, что блокируется.

Хотя эта статья посвящена реферальному спаму, важно отметить, что существуют и другие способы фильтрации спама в Google Analytics. Например, вы можете использовать приведенное выше руководство для поиска и фильтрации спама для следующих отчетов:

  • Язык
    • Тип фильтра: Настройки языка
  • Направление
    • Тип фильтра: Источник кампании*
  • Органическое ключевое слово
    • Тип фильтра: Срок поиска
  • Поставщик услуг
    • Тип фильтра: Организация провайдера
  • Сетевой домен
    • Тип фильтра: Домен провайдера

Примечание: Если вы собираетесь фильтровать реферальный спам по источнику, подумайте о добавлении элементов из черного списка рефералов Matomo (spammers.txt).

Связанное чтение:

  • 5 мощных плагинов аналитики и статистики для WordPress
  • Сравнение лучших инструментов аналитики веб-сайтов

Patrick Harvey

Патрик Харви — опытный писатель и специалист по цифровому маркетингу с более чем 10-летним опытом работы в отрасли. Он обладает обширными знаниями в различных темах, таких как ведение блогов, социальные сети, электронная коммерция и WordPress. Его страсть к писательству и помощи людям в достижении успеха в Интернете побудила его создавать проницательные и привлекательные посты, которые представляют ценность для его аудитории. Как опытный пользователь WordPress, Патрик знаком с тонкостями создания успешных веб-сайтов и использует эти знания, чтобы помочь компаниям и частным лицам установить свое присутствие в Интернете. Внимательный к деталям и непоколебимое стремление к совершенству, Патрик посвящает своих читателей последним тенденциям и советам в индустрии цифрового маркетинга. Когда он не ведет блог, Патрика можно найти за изучением новых мест, чтением книг или игрой в баскетбол.