Cách khắc phục thư rác giới thiệu trong Google Analytics

 Cách khắc phục thư rác giới thiệu trong Google Analytics

Patrick Harvey

Bạn có nhận được nhiều thư rác giới thiệu trong Google Analytics không? Bạn lo lắng các báo cáo của mình có thể bị ảnh hưởng bởi nó nhưng không chắc chắn lắm?

Trong bài đăng này, chúng tôi sẽ đề cập đến một số phương pháp khác nhau mà bạn có thể sử dụng để chặn thư rác giới thiệu trong các báo cáo của mình. Chúng tôi chủ yếu sẽ tập trung vào việc thực hiện điều này bằng một bộ lọc.

Trước tiên, hãy nói về thư rác giới thiệu là gì và tại sao đó là điều bạn muốn tránh.

Thư rác giới thiệu là gì?

Lưu lượng truy cập giới thiệu, còn được gọi là "lần truy cập", là lưu lượng truy cập không bắt nguồn từ công cụ tìm kiếm (lưu lượng truy cập không phải trả tiền) hoặc người dùng truy cập trang web của bạn bằng cách nhập tên miền của trang web vào thanh địa chỉ của họ (lưu lượng truy cập trực tiếp).

Ví dụ về lưu lượng truy cập giới thiệu bao gồm những lưu lượng truy cập được gửi từ các trang web truyền thông xã hội hoặc một trang web khác liên kết với trang web của bạn.

Lượt truy cập được ghi lại khi người dùng tương tác với trang web của bạn nhưng chúng chủ yếu đến từ các lượt truy cập. Trong Google Analytics, số lần truy cập được ghi lại dưới dạng số lần xem trang, sự kiện, giao dịch, v.v. Thư rác giới thiệu tạo ra các lượt truy cập giả mạo, phần lớn bắt nguồn từ bot hoặc trang web giả mạo.

Mỗi trang web có tài khoản Google Analytics đều có mã theo dõi riêng để xác định trang web đó. Đây là lý do tại sao bạn bắt buộc phải thêm tập lệnh Google Analytics vào các tệp trên trang web của mình để dịch vụ ghi lại dữ liệu lưu lượng truy cập và hành vi người dùng cho trang web của bạn. Mã này thường được đặt trong tiêu đề, mặc dù việc thêm mã thông qua plugin sẽ dễ dàng hơn nhiều.

Khi mộtsite—một dạng xem chính, một dạng dành cho dữ liệu chưa được lọc và một dạng để thử nghiệm. Kiểm tra kỹ khu vực Bộ lọc để biết chế độ xem chưa được lọc của bạn để đảm bảo không có chế độ xem nào vì điều quan trọng là bạn phải theo dõi những gì bị chặn.

Mặc dù bài viết này tập trung vào thư rác giới thiệu nhưng điều quan trọng cần lưu ý là bạn có thể lọc theo nhiều cách khác thư rác trong Google Analytics. Chẳng hạn, bạn có thể sử dụng hướng dẫn ở trên để tìm và lọc thư rác cho các báo cáo sau:

  • Ngôn ngữ
    • Loại bộ lọc: Cài đặt ngôn ngữ
  • Giới thiệu
    • Loại bộ lọc: Nguồn chiến dịch*
  • Từ khóa không phải trả tiền
    • Loại bộ lọc: Cụm từ tìm kiếm
  • Nhà cung cấp dịch vụ
    • Loại bộ lọc: Tổ chức ISP
  • Miền mạng
    • Loại bộ lọc: Miền ISP

Lưu ý: Nếu bạn định lọc thư rác giới thiệu theo nguồn, hãy xem xét thêm các mục từ danh sách đen liên kết giới thiệu của Matomo (spammers.txt).

Đọc liên quan:

  • 5 Plugin phân tích và thống kê mạnh mẽ cho WordPress
  • Các công cụ phân tích trang web tốt nhất được so sánh
người dùng hợp pháp truy cập trang web của bạn, dữ liệu sẽ đi qua máy chủ của bạn trước khi được gửi tới Google Analytics.

Khi xảy ra một dạng thư rác giới thiệu phổ biến, được gọi là "spam ma", những kẻ tấn công sử dụng tập lệnh tự động để gửi lưu lượng truy cập giả tới mã theo dõi Google Analytics ngẫu nhiên . Khi các lượt truy cập giả mạo này được gửi đến mã của bạn, kết quả là dữ liệu được ghi lại trong phân tích của bạn mặc dù thực tế là lưu lượng truy cập chưa bao giờ đến trang web của bạn.

Đôi khi các lượt giới thiệu giả mạo đến từ các trình thu thập dữ liệu độc hại. Lưu lượng truy cập được gửi qua loại thư rác giới thiệu này đi qua máy chủ của bạn, nhưng nó bỏ qua các quy tắc trong tệp robots.txt của trang web của bạn trong quá trình này. Sau đó, lưu lượng truy cập được gửi đến Google Analytics và được ghi lại dưới dạng một lượt truy cập.

Cách phát hiện thư rác giới thiệu trong Google Analytics

Bạn có thể tìm thấy thư rác giới thiệu cùng với các bản ghi giới thiệu khác của Google Analytics cho trang web của mình . Bạn sẽ tìm thấy những trang web này bằng cách chuyển đến Chuyển đổi → Tất cả lưu lượng truy cập → Giới thiệu.

Một số trang web spam rất dễ phát hiện. Họ thường có các miền kỳ quặc với tên không chuyên nghiệp, các cụm từ như “kiếm tiền” hoặc tham chiếu đến nội dung người lớn trong đó.

Họ cũng có thể có nhiều dấu gạch nối hoặc sử dụng phần mở rộng tên miền không chuẩn. Các lượt giới thiệu spam khác không dễ phát hiện, vì vậy, bạn sẽ cần sử dụng các phương pháp thay thế.

Nhân tiện, hãy đảm bảo bạn sử dụng phạm vi tùy chỉnh khi xem các lượt giới thiệu của mình trong Google Analytics. Đặt nóđể xem ít nhất hai tháng qua, nhưng bạn có thể quay lại bao xa tùy ý. Chỉ cần lưu ý rằng bạn càng quay trở lại, bạn càng cần sàng lọc nhiều dữ liệu hơn.

Bởi vì các lần truy cập ở dạng thư rác ma không bắt nguồn từ máy chủ thực của trang web của bạn nên chúng thường có tỷ lệ thoát là 100% và các phiên kéo dài 0 phút 0 giây. Nhấp vào cột Tỷ lệ thoát để sắp xếp dữ liệu theo tỷ lệ thoát cao nhất trước để giúp bạn thực hiện mọi việc dễ dàng hơn.

Xem thêm: 9 công cụ tiếp cận cộng đồng Blogger tốt nhất cho năm 2023

Spam của trình thu thập dữ liệu khó phát hiện hơn nhiều vì các bot này do truy cập vào trang web của bạn , vì vậy chúng thường sử dụng các URL hợp lệ và có dữ liệu phiên và thoát chính xác. Nếu bạn cho rằng một URL nguồn trong các báo cáo giới thiệu của mình là spam, đừng truy cập trang web để xác nhận nó.

Thay vào đó, hãy chạy nó qua tìm kiếm của Google bằng cách đặt nó trong dấu ngoặc kép (“google.com” chẳng hạn ) để xem liệu nó có bị báo cáo là spam hay không.

Nếu bạn truy cập các trang web này, hãy đảm bảo rằng bạn đang sử dụng các phiên bản trình duyệt mới nhất như Chrome và Firefox, cả hai đều có các biện pháp bảo vệ để bảo vệ bạn khỏi Trang web độc hại. Đảm bảo máy tính hoặc thiết bị của bạn cũng được cài đặt và kích hoạt phần mềm chống vi-rút trực tiếp trên đó.

Tại sao thư rác giới thiệu lại có hại?

Báo cáo Giới thiệu không phải là nơi duy nhất dữ liệu từ thư rác giới thiệu xâm nhập vào trong Google Analytics. Bạn sẽ tìm thấy nó trong các báo cáo của mình, đặc biệt là trong chế độ xem chính nơi tổng số lần truy cập vào trang web của bạn hoặccác trang riêng lẻ được định vị.

Nếu các báo cáo của bạn bị ảnh hưởng bởi các lượt truy cập không đại diện cho người thực, thì cuối cùng bạn có thể đưa ra các quyết định tiếp thị sai lầm dẫn đến các chiến dịch không thành công hoặc không kiếm được doanh thu .

Cần lưu ý rằng mặc dù Google đã làm rất nhiều việc để ngăn thư rác giới thiệu ảnh hưởng đến dữ liệu của bạn, nhưng đây là sự cố phổ biến ảnh hưởng đến phần lớn các trang web trên web.

Mặc dù vậy, bạn vẫn nên làm như vậy luôn chọn máy chủ chất lượng, sử dụng plugin bảo mật nếu bạn không sử dụng máy chủ WordPress được quản lý và chỉ cài đặt các chủ đề và plugin từ các nguồn đáng tin cậy, bạn không thể làm gì nhiều để ngăn chặn thư rác vì chúng không tấn công bạn trang web trực tiếp hoặc có cách để làm cho lưu lượng truy cập có vẻ hợp pháp.

Đó là lý do tại sao chúng tôi sẽ chỉ cho bạn cách khắc phục thư rác giới thiệu bằng cách lọc nó trong Google Analytics.

Cách khắc phục thư rác giới thiệu trong Google Analytics

Các bộ lọc trong Google Analytics là vĩnh viễn và không thể truy xuất dữ liệu đã lọc. Đây là lý do tại sao bạn phải luôn tạo chế độ xem chưa được lọc cho trang web của mình vì chế độ xem này cho phép bạn xem dữ liệu có thể đã bị lọc ra không chính xác. Công cụ này giúp bạn theo dõi lượng thư rác mà trang web của bạn nhận được ngay cả sau khi bạn áp dụng các bộ lọc để xóa nó.

Tạo chế độ xem không được lọc cho tài khoản Analytics trên trang web của bạn thật dễ dàng. Bắt đầu từ màn hình Quản trị (nút Quản trị nằm ở dưới cùng, góc bên trái) và nhấp vào Xem Cài đặttrong bảng Chế độ xem (bảng điều khiển bên phải).

Bắt đầu bằng cách đổi tên chế độ xem hiện tại của bạn, được gọi là “Tất cả dữ liệu trang web” theo mặc định, thành “Chế độ xem chính” bằng cách thay đổi tên trong trường Tên chế độ xem . Nhấp vào Lưu.

Nếu cuộn ngược lên trên cùng, bạn sẽ thấy một nút ở phía trên cùng bên phải của màn hình có nhãn “Chế độ xem sao chép”. Nhấp vào nó, đặt tên cho chế độ xem mới là “Chế độ xem chưa lọc” và nhấp vào Sao chép chế độ xem để xác nhận.

Bạn cũng có thể muốn quay lại Chế độ xem chính và lặp lại quy trình này để tạo một chế độ xem khác có tên là “Chế độ xem thử nghiệm”. Bạn có thể sử dụng chế độ xem này để thử nghiệm các bộ lọc mới trước khi áp dụng chúng vào chế độ xem chính.

Bạn hiện có chế độ xem chưa được lọc và có thể thử nghiệm trong Google Analytics. Nếu bạn đã áp dụng bộ lọc cho chế độ xem chính của mình, hãy xóa chúng khỏi chế độ xem chưa được lọc và chế độ xem thử nghiệm. Nếu không, bạn sẽ nhận được thông báo về các lượt xem dư thừa từ Google Analytics. Bạn có thể bỏ qua thông báo này một cách an toàn.

Khắc phục spam giới thiệu ma bằng một bộ lọc duy nhất

Bạn đã xác định được URL thư rác trong các báo cáo giới thiệu của bạn. Nhiều quản trị viên web ngay lập tức tạo các bộ lọc để chặn các URL này xuất hiện trong báo cáo của họ.

Thật không may, những kẻ gửi spam hiếm khi sử dụng một tên nguồn duy nhất trong các cuộc tấn công của chúng, điều đó có nghĩa là bạn sẽ cần liên tục tạo các bộ lọc mới để chặn mọi thư rác tiếp theo xuất hiện trong báo cáo của bạn.

Thay vào đó, điều bạn nên làm là tạo một bộ lọc chỉ bao gồmdữ liệu từ tên máy chủ thực.

Đằng sau mỗi miền là máy tính và mạng mà miền đó được gắn vào, có thể được xác định bằng địa chỉ IP. Các địa chỉ IP này được cung cấp "tên máy chủ" duy nhất để xác định chúng bằng tên chữ và số dễ nhớ.

Tiền tố “www” là tên máy chủ giống như mọi miền trên web vì cả hai đều được kết nối với máy tính hoặc mạng có địa chỉ IP.

Thư rác ma được gửi tới mã theo dõi Google Analytics ngẫu nhiên thay vì tên máy chủ được liên kết với trang web của bạn, vì vậy chúng sử dụng tên máy chủ giả để thay thế. Điều này có nghĩa là việc lọc ra các lượt giới thiệu sử dụng tên máy chủ giả sẽ hiệu quả hơn nhiều.

Bộ lọc mà chúng tôi sắp tạo cũng sẽ xóa các lượt truy cập giả do tên máy chủ giả tạo trong báo cáo từ khóa, số lần xem trang và lưu lượng truy cập trực tiếp của bạn.

Tạo biểu thức chính quy cho bộ lọc của bạn

Chúng tôi sẽ tạo bộ lọc chỉ bao gồm các lần truy cập từ tên máy chủ hợp lệ như một cách để loại trừ những tên giả mạo. Điều này có nghĩa là bạn sẽ cần tạo danh sách tên máy chủ hợp lệ được liên kết với trang web của mình.

Nếu bạn đã áp dụng các bộ lọc cho chế độ xem chính của mình, hãy chuyển sang chế độ xem chưa được lọc mà bạn đã tạo trước đó. Bạn sẽ tìm thấy tên máy chủ được Google Analytics xác định bằng cách đi tới Đối tượng → Công nghệ → Mạng và chuyển thứ nguyên chính thành Tên máy chủ.

Dưới đây là danh sách các loại tên máy chủ bạn muốn đưa vào báo cáo:

  • Tên miền – Đây là tên miền chínhtên máy chủ được sử dụng để xác định trang web của bạn trên web và một lượt giới thiệu hợp pháp sẽ đi qua, do đó, nó cần được đưa vào. Bạn có thể bỏ qua bất kỳ miền phụ nào mà bạn đã tạo vì chúng sẽ nằm trong miền chính của bạn.
  • Công cụ & Dịch vụ – Đây là những công cụ bạn sử dụng trên trang web của mình và có thể đã liên kết với tài khoản phân tích của bạn để thu thập dữ liệu cho các chiến dịch. Chúng bao gồm các công cụ như nhà cung cấp dịch vụ tiếp thị qua email, cổng thanh toán, dịch vụ dịch thuật và hệ thống đặt trước, nhưng bạn cũng đã tích hợp các công cụ bên ngoài, chẳng hạn như YouTube, vào số lượng tài khoản của mình.

Lập danh sách của tất cả các tên máy chủ hợp lệ được liên kết với trang web của bạn dựa trên các mẹo này, đảm bảo rằng mỗi tên khớp với giao diện của nó trong trường Tên máy chủ. Loại trừ các tên máy chủ sau:

  • Tên máy chủ chưa được đặt
  • Môi trường phát triển, chẳng hạn như máy chủ cục bộ hoặc miền phụ của môi trường chạy thử của bạn
  • Trang web lưu trữ và thu thập dữ liệu
  • Tên máy chủ có vẻ hợp pháp nhưng là trang web bạn không sở hữu hoặc công cụ và dịch vụ không được tích hợp với tài khoản Google Analytics của bạn. Đây có thể là thư rác được ngụy trang dưới dạng các nguồn hợp pháp.

Bây giờ, bạn sẽ có danh sách tên máy chủ hợp lệ của các nguồn mà bạn quản lý hoặc sử dụng với tài khoản Analytics của mình. Bây giờ, bạn cần tạo một biểu thức chính quy hoặc “regex”, kết hợp tất cả những điều này.

Một biểu thức chính quy làmột cách chính xác. Nhấp vào Lưu để tạo bộ lọc sau khi bạn hoàn tất.

Nếu tất cả đều ổn, hãy lặp lại quy trình với chế độ xem chính của bạn và xóa phiên bản thử nghiệm.

Lọc spam khỏi bot trình thu thập thông tin

Một số kẻ gửi thư rác sử dụng bot trình thu thập thông tin để gửi lượt truy cập giả mạo đến trang web của bạn. Ngoài ra, một số công cụ của bên thứ ba mà bạn sử dụng, bao gồm công cụ quản lý dự án và giám sát trang web, hoạt động thông qua bot trình thu thập thông tin nếu bạn tích hợp chúng vào trang web của mình.

Bạn có thể chặn loại spam này bằng cách tạo biểu thức tương tự nhưng sử dụng tên nguồn thay vì tên máy chủ. Điều hướng đến Đối tượng → Công nghệ → Mạng lần nữa và thêm Nguồn làm thứ nguyên phụ.

Dưới đây là hai biểu thức dựng sẵn khác nhau mà bạn có thể sử dụng từ trang web của Carlos Escalera Alonso nếu muốn tự mình làm mọi việc dễ dàng hơn.

Biểu thức 1:

semalt|ranksonic|timer4web|anticrawler|dailyrank|sitevaluation|uptime(robot|bot|check|\-|\.com)|foxweber|:8888|mycheaptraffic|bestbaby\.life|(blogping|blogseo)\.xyz|(10best|auto|express|audit|dollars|success|top1|amazon|commerce|resell|99)\-?seo

Biểu thức 2:

(artblog|howblog|seobook|merryblog|axcus|dotmass|artstart|dorothea|artpress|matpre|ameblo|freeseo|jimto|seo-tips|hazblog|overblog|squarespace|ronaldblog|c\.g456|zz\.glgoo|harriett)\.top|penzu\.xyz

Bạn cần xem qua các URL nguồn của mình để xác định công cụ nào gửi trình thu thập dữ liệu đến trang web của bạn và tạo biểu thức của riêng bạn cho chúng.

Khi bạn thêm các bộ lọc này vào chế độ xem thử nghiệm và chế độ xem chính của mình, hãy sử dụng Loại trừ làm Loại bộ lọc và Nguồn chiến dịch làm Trường bộ lọc của bạn.

Suy nghĩ cuối cùng

Thư rác giới thiệu có thể tàn phá phân tích trang web của bạn. Nó có thể khiến bạn có vẻ như có nhiều lượt truy cập hơn và tỷ lệ thoát cao hơn thực tế. Đó là lý do tại sao việc chặn thư rác giới thiệu trong báo cáo của bạn lại quan trọng.

Chỉ cần đảm bảo có ba chế độ xem khác nhau cho báo cáo của bạnmột chuỗi văn bản đặc biệt để mô tả một mẫu tìm kiếm. Mẫu tìm kiếm đó là danh sách tên máy chủ hợp lệ trong trường hợp này. Google Analytics sẽ sử dụng biểu thức này để xác định tên máy chủ mà bạn muốn đưa vào dữ liệu của mình sau khi tạo bộ lọc.

Dưới đây là ví dụ về giao diện biểu thức của bạn:

Xem thêm: Cách tạo trang bán hàng cho sản phẩm hoặc khóa học trực tuyến đầu tiên của bạn
yourdomain.com|examplehostname.com|anotherhostname

Đường ống

Patrick Harvey

Patrick Harvey là một nhà văn và nhà tiếp thị kỹ thuật số dày dạn kinh nghiệm với hơn 10 năm kinh nghiệm trong ngành. Anh ấy có kiến ​​thức sâu rộng về nhiều chủ đề khác nhau như viết blog, mạng xã hội, thương mại điện tử và WordPress. Niềm đam mê viết lách và giúp mọi người thành công trực tuyến đã thúc đẩy anh ấy tạo ra các bài đăng sâu sắc và hấp dẫn mang lại giá trị cho khán giả của mình. Là một người dùng WordPress thành thạo, Patrick đã quen thuộc với kiến ​​thức cơ bản về xây dựng các trang web thành công và anh ấy sử dụng kiến ​​thức này để giúp các doanh nghiệp cũng như cá nhân thiết lập sự hiện diện trực tuyến của họ. Với con mắt tinh tường về chi tiết và cam kết không ngừng hướng tới sự xuất sắc, Patrick tận tâm cung cấp cho độc giả của mình những xu hướng và lời khuyên mới nhất trong ngành tiếp thị kỹ thuật số. Khi không viết blog, người ta có thể bắt gặp Patrick đang khám phá những địa điểm mới, đọc sách hoặc chơi bóng rổ.