Як виправити реферальний спам у Google Analytics

 Як виправити реферальний спам у Google Analytics

Patrick Harvey

Ви отримуєте багато реферального спаму в Google Analytics? Ви стурбовані тим, що він може вплинути на ваші звіти, але не впевнені?

У цій статті ми розглянемо кілька різних методів, які ви можете використовувати для блокування реферального спаму у своїх звітах. Ми зосередимося на тому, як зробити це за допомогою одного фільтра.

Спочатку давайте поговоримо про те, що таке реферальний спам і чому його потрібно уникати.

Що таке реферальний спам?

Реферальний трафік, також відомий як "хіт", - це трафік, який походить не з пошукових систем (органічний трафік) і не від користувачів, які заходять на ваш сайт, вводячи його домен в адресному рядку (прямий трафік).

Прикладами реферального трафіку є трафік із соціальних мереж або з інших сайтів, які посилаються на ваш сайт.

Переходи реєструються, коли користувачі взаємодіють з вашим сайтом, але в основному вони походять від відвідувань. В Google Analytics переходи реєструються як перегляди сторінок, події, транзакції тощо. Реферальний спам генерує фальшиві переходи, які здебільшого походять від ботів або фальшивих веб-сайтів.

Кожен сайт з обліковим записом Google Analytics має власний код відстеження, який його ідентифікує. Ось чому вам потрібно додати скрипт Google Analytics до файлів вашого сайту, щоб сервіс міг записувати дані про трафік і поведінку користувачів на вашому сайті. Цей код зазвичай розміщується в заголовку, хоча набагато простіше додати його за допомогою плагіна.

Коли легальний користувач відвідує ваш сайт, дані проходять через ваш сервер, перш ніж потрапляють до Google Analytics.

Коли виникає поширена форма реферального спаму, відома як "спам-привид", зловмисники використовують автоматизовані скрипти для надсилання фейкового трафіку на випадкові коди відстеження Google Analytics Коли ці фейкові переходи надсилаються до вашого коду, дані фіксуються у вашій аналітиці, незважаючи на те, що трафік ніколи не потрапляв на ваш сайт.

Іноді фальшиві реферали надходять від зловмисних пошукових роботів. Трафік, що надсилається через цей тип реферального спаму робить проходять через ваш сервер, але при цьому ігнорують правила у файлі robots.txt вашого сайту. Потім трафік надсилається до Google Analytics і фіксується як хіт.

Як виявити реферальний спам у Google Analytics

Ви можете знайти реферальний спам разом з іншими записами Google Analytics для вашого сайту. Ви можете знайти їх, перейшовши за посиланням Придбання → Весь трафік → Реферали.

Деякі спам-сайти легко виявити. Вони, як правило, мають дивні домени з непрофесійними назвами, фразами на кшталт "заробити гроші" або посиланнями на контент для дорослих.

Вони також можуть мати багато дефісів або використовувати нестандартні розширення доменів. Інші спам-реферали не так легко виявити, тому вам доведеться використовувати альтернативні методи.

До речі, переконайтеся, що ви використовуєте спеціальний діапазон для перегляду ваших рефералів у Google Analytics. Встановіть його для перегляду останніх двох місяців, але ви можете повернутися так далеко назад, як захочете. Просто зауважте, що чим далі ви повертаєтеся, тим більше даних вам потрібно буде просіяти.

Оскільки спам-примари надходять не з реального сервера вашого сайту, вони зазвичай мають показник відмов 100%, а сеанси тривають 0 хвилин і 0 секунд. Клацніть на стовпчик "Показник відмов", щоб спочатку відсортувати дані за найвищим показником відмов, щоб полегшити собі роботу.

Гусеничний спам набагато складніше виявити, оскільки ці боти робити відвідують ваш сайт, тому вони зазвичай використовують валідні URL-адреси і мають точні дані про відмову та сесії. Якщо ви вважаєте, що URL-адреса джерела у ваших реферальних звітах є спамом, не переходьте на сайт, щоб підтвердити її.

Замість цього запустіть його через пошук Google, взявши його в лапки ("google.com", наприклад), щоб перевірити, чи не було воно віднесено до спаму.

Якщо ви відвідуєте ці сайти, переконайтеся, що ви використовуєте найновіші версії браузерів, таких як Chrome і Firefox, які мають засоби захисту від шкідливих сайтів. Переконайтеся, що на вашому комп'ютері або пристрої також встановлене і активне антивірусне програмне забезпечення.

Чому реферальний спам - це погано?

Звіт "Реферали" - не єдине місце, куди просочуються дані від реферального спаму в Google Analytics. Ви знайдете їх у всіх ваших звітах, особливо в основному поданні, де відображається загальна кількість переходів на ваш сайт або окремі сторінки.

Якщо ваші звіти заплямовані відвідуваннями, які не представляють реальних людей, ви можете прийняти помилкові маркетингові рішення, які призведуть до того, що кампанії або не стартують, або не принесуть доходу.

Слід зазначити, що хоча Google зробив багато для того, щоб реферальний спам не впливав на ваші дані, це поширене явище, яке зачіпає більшість сайтів в Інтернеті.

Хоча ви завжди повинні обирати якісний хостинг, використовувати плагін безпеки, якщо ви не використовуєте керований хостинг WordPress, і встановлювати теми і плагіни тільки з перевірених джерел, ви не можете зробити багато для стримування спаму, оскільки вони або не атакують ваш сайт безпосередньо, або мають способи зробити так, щоб трафік виглядав легітимним.

Ось чому ми покажемо вам, як виправити реферальний спам, відфільтрувавши його в Google Analytics.

Як виправити реферальний спам в Google Analytics

Фільтри в Google Analytics є постійними, і відфільтровані дані не можуть бути відновлені. Ось чому ви завжди повинні створювати нефільтроване подання для свого сайту, оскільки воно дозволяє бачити дані, які могли бути неправильно відфільтровані. Це допомагає вам контролювати кількість спаму, який отримує ваш сайт, навіть після того, як ви застосуєте фільтри для його видалення.

Створити нефільтроване подання для облікового запису Analytics вашого сайту дуже просто. Почніть з екрану адміністратора (кнопка "Адміністрування" знаходиться внизу, в лівому кутку) і натисніть "Налаштування подання" на панелі "Подання" (права панель).

Почніть з перейменування поточного подання, яке за замовчуванням називається "Всі дані веб-сайту", на "Основне подання", змінивши назву в полі "Назва подання". Натисніть "Зберегти".

Якщо ви прокрутите сторінку назад догори, ви побачите кнопку у верхній правій частині екрана з написом "Копіювати подання". Натисніть її, назвіть нове подання "Нефільтроване подання" і натисніть кнопку "Копіювати подання", щоб підтвердити це.

Ви також можете повернутися до основного подання і повторити цей процес, щоб створити ще одне подання під назвою "Тестове подання". Ви можете використовувати це подання для тестування нових фільтрів, перш ніж застосовувати їх до основного подання.

Тепер у вас є нефільтроване і, можливо, тестове подання в Google Analytics. Якщо ви застосували фільтри до основного подання, видаліть їх з нефільтрованого і тестового подань. Якщо ви цього не зробили, ви отримаєте повідомлення про надлишкові подання від Google Analytics, яке можете сміливо ігнорувати.

Виправлення спаму з примарними рефералами за допомогою одного фільтра

Ви вже визначили спам URL-адреси у своїх реферальних звітах. Багато веб-майстрів створюють фільтри, щоб заблокувати ці URL-адреси у своїх звітах.

На жаль, спамери рідко використовують одне ім'я джерела у своїх атаках, а це означає, що вам доведеться постійно створювати нові фільтри, щоб блокувати будь-який наступний спам, який з'являється у ваших звітах.

Замість цього вам слід створити фільтр, який включатиме дані лише з реальних імен хостів.

За кожним доменом стоїть комп'ютер і мережа, до якої він підключений, які можна ідентифікувати за IP-адресою. Цим IP-адресам присвоюються унікальні "імена хостів", щоб ідентифікувати їх за допомогою легких для запам'ятовування алфавітно-цифрових назв.

Префікс "www" - це ім'я хоста, як і кожен домен в Інтернеті, оскільки вони обидва підключені до комп'ютерів або мереж з IP-адресами.

Примарний спам надсилається на випадкові коди відстеження Google Analytics, а не на хости, пов'язані з вашим сайтом, тому вони використовують фальшиві хости. Це означає, що набагато ефективніше відфільтровувати рефералів, які використовують фальшиві хости.

Фільтр, який ми збираємося створити, також видалятиме фальшиві переходи, створені фальшивими іменами хостів у ваших звітах за ключовими словами, переглядом сторінок і прямим трафіком.

Створення регулярного виразу для фільтра

Ми створимо фільтр, який буде включати в себе тільки переходи з дійсних хостів, щоб виключити підроблені. Це означає, що вам потрібно буде створити список дійсних хостів, пов'язаних з вашим сайтом.

Дивіться також: Missinglettr Review 2023: Як створювати унікальні кампанії в соціальних мережах

Якщо до основного подання застосовано фільтри, перейдіть до нефільтрованого подання, яке ви створили раніше. Ви знайдете імена хостів, ідентифіковані Google Analytics, перейшовши до Аудиторія → Технологія → Мережа і переключивши основний вимір на Ім'я хоста.

Ось список типів імен хостів, які потрібно включати до звітів:

  • Домен - Це основне ім'я хоста, яке використовується для ідентифікації вашого сайту в Інтернеті, і саме через нього будуть проходити легальні реферали, тому його потрібно вказати. Ви можете ігнорувати будь-які створені вами субдомени, оскільки вони будуть покриватися вашим основним доменом.
  • Інструменти та послуги - Це інструменти, які ви використовуєте на своєму веб-сайті і, можливо, пов'язані з вашим обліковим записом аналітики для збору даних для кампаній. Вони включають такі інструменти, як ваш постачальник послуг email-маркетингу, платіжні шлюзи, служби перекладу та системи бронювання, а також зовнішні інструменти, такі як YouTube, які ви також інтегрували у свій обліковий запис.

Складіть список усіх дійсних хост-імен, пов'язаних з вашим сайтом, на основі цих порад, переконавшись, що кожне ім'я відповідає тому, як воно виглядає в полі "Ім'я хоста". Виключіть наступні хост-імена:

  • Імена хостів, які не встановлено
  • Середовища розробки, такі як localhost або субдомен вашого середовища розробки
  • Архіви та місця для скрепінгу
  • Імена хостів, які виглядають легітимно, але є або сайтами, які вам не належать, або інструментами та сервісами, які не інтегровані з вашим акаунтом Google Analytics. Це, швидше за все, спам, який маскується під легітимні джерела.

Тепер у вас повинен бути список дійсних хост-імен джерел, якими ви керуєте або використовуєте в своєму обліковому записі Analytics. Тепер вам потрібно створити регулярний вираз, або "реґекс", який об'єднає всі ці імена.

Регулярний вираз - це спеціальний текстовий рядок для опису шаблону пошуку. У цьому випадку шаблон пошуку - це список допустимих імен хостів. Google Analytics використовуватиме цей вираз для визначення імен хостів, які ви хочете включити у свої дані після створення фільтра.

Ось приклад того, як має виглядати ваш вираз:

 yourdomain.com 

Труба Тут важливі символи OR, які означають АБО і допомагають Google Analytics відрізнити кожне ім'я хоста від іншого. Ви ніколи не повинні вставляти символи труб на початку або в кінці виразу, тому не починайте і не закінчуйте регулярний вираз з .

Створення фільтра

Перейдіть на екран адміністратора і перейдіть до тестового перегляду, якщо ви його створили. Перейдіть до основного перегляду, якщо ні.

Клацніть на посилання Фільтри під правою колонкою Вигляд, а потім натисніть червону кнопку Додати фільтр. Ось короткий список того, як налаштувати цей фільтр:

  • Метод: Створити новий фільтр
  • Ім'я: Щось описове, наприклад, "Дійсні імена хостів"
  • Тип фільтра: Нестандартний
    • Переконайтеся, що вибрано опцію Включити
  • Поле фільтрації : Ім'я хоста
  • Шаблон фільтра: Скопіюйте та вставте свій вираз сюди, не допускаючи пропусків

Після того, як ви вставили вираз у поле Шаблон фільтрації, натисніть посилання Перевірити цей фільтр, щоб перевірити, чи правильно буде відфільтровано небажані імена хостів. Натисніть Зберегти, щоб створити фільтр після завершення.

Якщо все гаразд, повторіть процес з основним поданням і видаліть тестову версію.

Фільтруйте спам від пошукових роботів

Деякі спамери використовують пошукових роботів, щоб надсилати фальшиві переходи на ваш сайт. Крім того, деякі сторонні інструменти, які ви використовуєте, зокрема інструменти для управління проектами та моніторингу сайтів, працюють через пошукових роботів, якщо ви інтегрували їх на свій сайт.

Ви можете заблокувати цей тип спаму, створивши подібний вираз, але використовуючи імена джерел замість імен хостів. Знову перейдіть до Аудиторія → Технологія → Мережа і додайте Джерело як додатковий вимір.

Ось два різних готових виразів, які ви можете використовувати з сайту Carlos Escalera Alonso, якщо хочете полегшити собі роботу.

Вираз 1:

 семалт 

Вираз 2:

 (арт-блог 

Вам потрібно буде переглянути вихідні URL-адреси, щоб визначити, які інструменти посилають роботів на ваш сайт, і створити для них власний вираз.

Коли ви додаєте ці фільтри до тестових і основних подань, використовуйте "Виключити" як тип фільтра і "Джерело кампанії" як поле фільтра.

Заключні думки

Реферальний спам може спричинити хаос в аналітиці вашого сайту. Він може створити враження, що у вас більше переходів і вищий показник відмов, ніж є насправді. Ось чому важливо блокувати реферальний спам у своїх звітах.

Просто переконайтеся, що у вас є три різних подання для вашого сайту - одне основне, одне для нефільтрованих даних і одне для тестування. Перевірте область фільтрів для нефільтрованого подання, щоб переконатися, що їх немає, оскільки вам важливо відстежувати, що блокується.

Хоча ця стаття була присвячена реферальному спаму, важливо зазначити, що існують додаткові способи фільтрації спаму в Google Analytics. Наприклад, ви можете скористатися наведеною вище інструкцією, щоб знайти і відфільтрувати спам для наступних звітів:

Дивіться також: 5 способів створити активну спільноту в соціальних мережах
  • Мова
    • Тип фільтра: Налаштування мови
  • Направлення
    • Тип фільтра: Джерело кампанії* Джерело кампанії
  • Органічне ключове слово
    • Тип фільтра: Пошуковий термін
  • Постачальник послуг
    • Тип фільтра: Організація інтернет-провайдера
  • Мережевий домен
    • Тип фільтра: Домен провайдера

Зауважте: Якщо ви збираєтеся фільтрувати реферальний спам за джерелом, додайте елементи з чорного списку рефералів Matomo (spammers.txt).

Пов'язана література:

  • 5 потужних плагінів аналітики та статистики для WordPress
  • Порівняння найкращих інструментів аналітики веб-сайтів

Patrick Harvey

Патрік Гарві — досвідчений письменник і цифровий маркетолог із понад 10-річним досвідом роботи в галузі. Він має глибокі знання з різних тем, таких як ведення блогів, соціальні мережі, електронна комерція та WordPress. Його пристрасть писати та допомагати людям досягати успіху в Інтернеті спонукала його створювати проникливі та привабливі дописи, які є цінними для його аудиторії. Як досвідчений користувач WordPress, Патрік знайомий із тонкощами створення успішних веб-сайтів, і він використовує ці знання, щоб допомогти компаніям і окремим особам створити свою присутність в Інтернеті. З гострим поглядом на деталі та непохитним прагненням до досконалості Патрік прагне надавати своїм читачам останні тенденції та поради в галузі цифрового маркетингу. Коли Патрік не веде блог, він досліджує нові місця, читає книги або грає в баскетбол.