วิธีแก้ไขสแปมการอ้างอิงใน Google Analytics
สารบัญ
คุณได้รับสแปมการอ้างอิงจำนวนมากใน Google Analytics หรือไม่ คุณกังวลหรือไม่ว่ารายงานของคุณอาจถูกแฮ็ก แต่ไม่แน่ใจ
ในโพสต์นี้ เราจะกล่าวถึงวิธีการต่างๆ 2-3 วิธีที่คุณสามารถใช้เพื่อบล็อกสแปมการอ้างอิงในรายงานของคุณ เราจะมุ่งเน้นไปที่การทำสิ่งนี้ให้สำเร็จด้วยตัวกรองเดียวเป็นหลัก
ก่อนอื่น เรามาพูดถึงว่าสแปมการอ้างอิงคืออะไร และเหตุใดจึงเป็นสิ่งที่คุณต้องการหลีกเลี่ยง
สแปมการอ้างอิงคืออะไร
การเข้าชมจากการอ้างอิง หรือที่เรียกว่า "Hit" คือการเข้าชมที่ไม่ได้มาจากเครื่องมือค้นหา (การเข้าชมทั่วไป) หรือผู้ใช้ที่เข้าชมเว็บไซต์ของคุณโดยการป้อนโดเมนในแถบที่อยู่ (การเข้าชมโดยตรง)
ตัวอย่างการเข้าชมจากการอ้างอิง ได้แก่ การเข้าชมที่ส่งมาจากไซต์โซเชียลมีเดียหรือไซต์อื่นที่เชื่อมโยงมายังไซต์ของคุณ
การเข้าชมจะถูกบันทึกเมื่อผู้ใช้โต้ตอบกับเว็บไซต์ของคุณ แต่ส่วนใหญ่มาจากการเข้าชม ใน Google Analytics Hit จะถูกบันทึกเป็นการดูหน้าเว็บ เหตุการณ์ ธุรกรรม และอื่นๆ สแปมการอ้างอิงสร้างการเข้าชมปลอมซึ่งส่วนใหญ่มาจากบอทหรือเว็บไซต์ปลอม
ทุกเว็บไซต์ที่มีบัญชี Google Analytics มีรหัสติดตามของตัวเองที่ระบุถึงมัน นี่คือเหตุผลที่คุณต้องเพิ่มสคริปต์ Google Analytics ลงในไฟล์ของไซต์ของคุณเพื่อให้บริการบันทึกข้อมูลการเข้าชมและพฤติกรรมผู้ใช้สำหรับไซต์ของคุณ โดยปกติแล้วโค้ดนี้จะวางไว้ในส่วนหัว แม้ว่าการเพิ่มผ่านปลั๊กอินจะง่ายกว่ามาก
เมื่อไซต์ — หนึ่งมุมมองหลัก หนึ่งมุมมองสำหรับข้อมูลที่ไม่ได้กรอง และอีกมุมมองหนึ่งสำหรับการทดสอบ ตรวจสอบพื้นที่ตัวกรองอีกครั้งสำหรับมุมมองที่ไม่ผ่านการกรองของคุณเพื่อให้แน่ใจว่าไม่มีเลย เนื่องจากการตรวจสอบสิ่งที่ถูกบล็อกเป็นสิ่งสำคัญสำหรับคุณ
แม้ว่าบทความนี้จะมุ่งเน้นไปที่สแปมการอ้างอิง สิ่งสำคัญคือต้องทราบว่ามีวิธีเพิ่มเติมที่คุณสามารถกรองได้ สแปมใน Google Analytics ตัวอย่างเช่น คุณสามารถใช้คำแนะนำด้านบนเพื่อค้นหาและกรองสแปมสำหรับรายงานต่อไปนี้:
- ภาษา
- ประเภทตัวกรอง: การตั้งค่าภาษา
- การอ้างอิง
- ประเภทตัวกรอง: แหล่งที่มาของแคมเปญ*
- คำหลักทั่วไป
- ประเภทตัวกรอง: ข้อความค้นหา
- ผู้ให้บริการ
- ประเภทตัวกรอง: องค์กร ISP
- โดเมนเครือข่าย
- ประเภทตัวกรอง: โดเมน ISP
หมายเหตุ: หากคุณกำลังจะกรอง สแปมอ้างอิงตามแหล่งที่มา พิจารณาเพิ่มรายการจากบัญชีดำผู้อ้างอิงของ Matomo (spammers.txt)
การอ่านที่เกี่ยวข้อง:
- 5 ปลั๊กอินการวิเคราะห์และสถิติที่มีประสิทธิภาพสำหรับ WordPress
- เปรียบเทียบเครื่องมือวิเคราะห์เว็บไซต์ที่ดีที่สุด
เมื่อเกิดสแปมอ้างอิงรูปแบบทั่วไปที่เรียกว่า "สแปมโกสต์" ผู้โจมตีจะใช้สคริปต์อัตโนมัติ เพื่อส่งการเข้าชมปลอมไปยังโค้ดติดตาม Google Analytics แบบสุ่ม เมื่อ Hit ปลอมเหล่านี้ถูกส่งไปยังโค้ดของคุณ ข้อมูลจะถูกบันทึกในการวิเคราะห์ของคุณ แม้ว่าการเข้าชมจะไม่มาถึงไซต์ของคุณก็ตาม
บางครั้งการอ้างอิงปลอมมาจากโปรแกรมรวบรวมข้อมูลที่เป็นอันตราย การเข้าชมที่ส่งผ่านสแปมการอ้างอิงประเภทนี้ ไม่ ผ่านเซิร์ฟเวอร์ของคุณ แต่จะไม่สนใจกฎในไฟล์ robots.txt ของไซต์ของคุณในกระบวนการนี้ จากนั้นการเข้าชมจะถูกส่งไปยัง Google Analytics และบันทึกเป็น Hit
วิธีตรวจหาสแปมการอ้างอิงใน Google Analytics
คุณสามารถค้นหาสแปมการอ้างอิงควบคู่ไปกับบันทึกการอ้างอิงอื่นๆ ของ Google Analytics สำหรับไซต์ของคุณ . คุณจะพบสิ่งเหล่านี้ได้โดยไปที่การได้มา → การเข้าชมทั้งหมด → การอ้างอิง
เว็บไซต์สแปมบางเว็บไซต์สามารถตรวจจับได้ง่าย พวกเขามักจะมีโดเมนแปลก ๆ ที่ชื่อไม่เป็นมืออาชีพ วลีเช่น "สร้างรายได้" หรือการอ้างอิงถึงเนื้อหาสำหรับผู้ใหญ่ในโดเมนนั้น
ดูสิ่งนี้ด้วย: 10 ทางเลือก YouTube ที่ดีที่สุดสำหรับปี 2023 (การเปรียบเทียบ)พวกเขาอาจมียัติภังค์จำนวนมากหรือใช้นามสกุลโดเมนที่ไม่ได้มาตรฐาน การอ้างอิงสแปมอื่นๆ นั้นไม่ง่ายนัก ดังนั้นคุณจะต้องใช้วิธีอื่น
ยังไงก็ตาม ตรวจสอบให้แน่ใจว่าคุณใช้ช่วงที่กำหนดเองเมื่อดูการอ้างอิงของคุณใน Google Analytics ตั้งค่าเพื่อดูสองเดือนที่ผ่านมาเป็นอย่างน้อย แต่คุณสามารถย้อนกลับไปได้ไกลแค่ไหนก็ได้ โปรดทราบว่ายิ่งคุณย้อนกลับมากเท่าไหร่ คุณก็ยิ่งต้องกรองข้อมูลมากขึ้นเท่านั้น
เนื่องจากการเข้าชมในรูปแบบของสแปมผีไม่ได้มาจากเซิร์ฟเวอร์จริงของไซต์คุณ จึงมักจะมีอัตราตีกลับ 100% และเซสชันยาวนาน 0 นาที 0 วินาที คลิกคอลัมน์อัตราตีกลับเพื่อจัดเรียงข้อมูลตามอัตราตีกลับสูงสุดก่อน เพื่อทำให้ตัวคุณเองง่ายขึ้น
สแปมของโปรแกรมรวบรวมข้อมูลตรวจจับได้ยากกว่ามาก เนื่องจากบอทเหล่านี้ ทำ ไปที่ไซต์ของคุณ ดังนั้น โดยทั่วไปแล้ว พวกเขาจะใช้ URL ที่ถูกต้องและมีข้อมูลการตีกลับและเซสชันที่ถูกต้อง หากคุณคิดว่า URL ต้นทางในรายงานอ้างอิงของคุณเป็นสแปม อย่าเข้าไปที่ไซต์เพื่อยืนยัน URL นั้น
ให้เรียกใช้ผ่านการค้นหาโดย Google โดยล้อมรอบด้วยเครื่องหมายคำพูด (“google.com” เป็นต้น ) เพื่อดูว่าถูกรายงานว่าเป็นสแปมหรือไม่
หากคุณเข้าชมไซต์เหล่านี้ ตรวจสอบให้แน่ใจว่าคุณใช้เบราว์เซอร์เวอร์ชันล่าสุด เช่น Chrome และ Firefox ซึ่งทั้งสองเบราว์เซอร์มีการป้องกันเพื่อป้องกันคุณจาก เว็บไซต์ที่เป็นอันตราย ตรวจสอบให้แน่ใจว่าคอมพิวเตอร์หรืออุปกรณ์ของคุณมีซอฟต์แวร์ป้องกันไวรัสที่ติดตั้งอยู่และเปิดใช้งานอยู่
ทำไมสแปมการอ้างอิงถึงไม่ดี
รายงานการอ้างอิงไม่ได้เป็นเพียงที่เดียวที่ข้อมูลจากสแปมการอ้างอิงเข้ามา ใน Google Analytics คุณจะพบได้ในรายงานของคุณ โดยเฉพาะในมุมมองหลักที่จำนวนรวมของการเข้าชมไซต์ของคุณหรือหน้าเว็บแต่ละหน้าอยู่
หากรายงานของคุณเสียหายจากจำนวนผู้เข้าชมที่ไม่ได้แสดงถึงบุคคลจริง คุณอาจลงเอยด้วยการตัดสินใจทางการตลาดที่ผิดพลาดซึ่งนำไปสู่แคมเปญที่ไม่ได้รับความนิยมหรือไม่ได้รับรายได้
ควรสังเกตว่า แม้ว่า Google จะทำหลายอย่างเพื่อหยุดสแปมการอ้างอิงไม่ให้ส่งผลกระทบต่อข้อมูลของคุณ แต่ก็เป็นเรื่องปกติที่ส่งผลกระทบต่อเว็บไซต์ส่วนใหญ่บนเว็บ
ในขณะที่คุณควรทำ เลือกโฮสต์ที่มีคุณภาพเสมอ ใช้ปลั๊กอินความปลอดภัยหากคุณไม่ได้ใช้โฮสต์ WordPress ที่มีการจัดการ และติดตั้งธีมและปลั๊กอินจากแหล่งที่เชื่อถือได้เท่านั้น คุณไม่สามารถทำอะไรได้มากนักเพื่อยับยั้งสแปม เนื่องจากพวกมันไม่ได้โจมตีคุณ ไซต์โดยตรงหรือมีวิธีทำให้การเข้าชมดูถูกต้อง
นั่นคือเหตุผลที่เราจะแสดงวิธีแก้ไขสแปมการอ้างอิงด้วยการกรองใน Google Analytics
วิธีแก้ไขสแปมการอ้างอิง ใน Google Analytics
ตัวกรองใน Google Analytics เป็นแบบถาวร และไม่สามารถเรียกคืนข้อมูลที่กรองได้ นี่คือเหตุผลที่คุณควรสร้างข้อมูลพร็อพเพอร์ตี้ที่ไม่มีการกรองสำหรับไซต์ของคุณเสมอ เนื่องจากข้อมูลพร็อพเพอร์ตี้นี้ช่วยให้คุณเห็นข้อมูลที่อาจถูกกรองออกอย่างไม่ถูกต้อง ช่วยให้คุณตรวจสอบปริมาณสแปมที่ไซต์ของคุณได้รับ แม้ว่าคุณจะใช้ตัวกรองเพื่อลบออกแล้วก็ตาม
การสร้างข้อมูลพร็อพเพอร์ตี้ที่ไม่มีการกรองสำหรับบัญชี Analytics ของไซต์ของคุณนั้นเป็นเรื่องง่าย เริ่มจากหน้าจอผู้ดูแลระบบ (ปุ่มผู้ดูแลระบบอยู่ที่ด้านล่าง มุมซ้าย) แล้วคลิกดูการตั้งค่าใต้แผงมุมมอง (แผงด้านขวา)
เริ่มด้วยการเปลี่ยนชื่อมุมมองปัจจุบันของคุณ ซึ่งเรียกว่า "ข้อมูลเว็บไซต์ทั้งหมด" ตามค่าเริ่มต้น เป็น "มุมมองหลัก" โดยเปลี่ยนชื่อในช่องชื่อมุมมอง . คลิกบันทึก
หากคุณเลื่อนกลับไปด้านบนสุด คุณจะเห็นปุ่มไปทางด้านขวาบนของหน้าจอที่มีข้อความว่า "คัดลอกมุมมอง" คลิกแล้วตั้งชื่อมุมมองใหม่ว่า "มุมมองที่ไม่กรอง" แล้วคลิกคัดลอกมุมมองเพื่อยืนยัน
คุณอาจต้องการกลับไปที่มุมมองหลักและทำขั้นตอนนี้ซ้ำเพื่อสร้างมุมมองอื่นที่เรียกว่า "มุมมองทดสอบ" คุณสามารถใช้ข้อมูลพร็อพเพอร์ตี้นี้เพื่อทดสอบตัวกรองใหม่ก่อนที่จะนำไปใช้กับข้อมูลพร็อพเพอร์ตี้หลัก
ตอนนี้คุณมีข้อมูลพร็อพเพอร์ตี้ที่ยังไม่ได้กรองและอาจทดสอบได้ใน Google Analytics หากคุณใช้ตัวกรองกับมุมมองหลัก ให้ลบออกจากมุมมองที่ไม่กรองและทดสอบ หากคุณไม่ได้รับการแจ้งเตือน คุณจะได้รับการแจ้งเตือนเกี่ยวกับการดูที่ซ้ำซ้อนจาก Google Analytics ซึ่งคุณสามารถเพิกเฉยได้
แก้ไขสแปมการอ้างอิงผีด้วยตัวกรองเดียว
คุณได้ระบุแล้ว URL สแปมในรายงานการอ้างอิงของคุณ ผู้ดูแลเว็บจำนวนมากดำเนินการทันทีและสร้างตัวกรองเพื่อบล็อก URL เหล่านี้ไม่ให้ปรากฏในรายงานของตน
น่าเสียดายที่นักส่งสแปมไม่ค่อยใช้ชื่อแหล่งที่มาเดียวในการโจมตี ซึ่งหมายความว่าคุณจะต้องสร้างตัวกรองใหม่อย่างต่อเนื่องเพื่อบล็อก สแปมที่ตามมาซึ่งปรากฏในรายงานของคุณ
สิ่งที่คุณควรทำคือสร้างตัวกรองที่มีเฉพาะข้อมูลจากชื่อโฮสต์จริง
เบื้องหลังทุกโดเมนคือคอมพิวเตอร์และเครือข่ายที่เชื่อมต่ออยู่ ซึ่งสามารถระบุได้ด้วยที่อยู่ IP ที่อยู่ IP เหล่านี้ได้รับ "ชื่อโฮสต์" ที่ไม่ซ้ำกันเพื่อระบุด้วยชื่อที่เป็นตัวอักษรและตัวเลขคละกันที่จำง่าย
คำนำหน้า "www" เป็นชื่อโฮสต์เช่นเดียวกับทุกโดเมนบนเว็บ เนื่องจากทั้งคู่เชื่อมต่อกับคอมพิวเตอร์ หรือเครือข่ายที่มีที่อยู่ IP
สแปมผีถูกส่งไปยังรหัสติดตาม Google Analytics แบบสุ่มแทนที่จะส่งชื่อโฮสต์ที่เชื่อมโยงกับไซต์ของคุณ ดังนั้นพวกเขาจึงใช้ชื่อโฮสต์ปลอมแทน ซึ่งหมายความว่าการกรองผู้อ้างอิงที่ใช้ชื่อโฮสต์ปลอมออกจะมีประสิทธิภาพมากกว่า
ตัวกรองที่เราจะสร้างจะลบ Hit ปลอมที่สร้างโดยชื่อโฮสต์ปลอมในคำหลัก การดูหน้าเว็บ และรายงานการเข้าชมโดยตรงของคุณด้วย
สร้างนิพจน์ทั่วไปสำหรับตัวกรองของคุณ
เราจะสร้างตัวกรองที่รวมเฉพาะการเข้าชมจากชื่อโฮสต์ที่ถูกต้องเพื่อแยกการปลอมออก ซึ่งหมายความว่าคุณจะต้องสร้างรายชื่อโฮสต์ที่ถูกต้องซึ่งเชื่อมโยงกับไซต์ของคุณ
หากคุณใช้ตัวกรองกับมุมมองหลัก ให้เปลี่ยนไปใช้มุมมองที่ไม่มีการกรองที่คุณสร้างไว้ก่อนหน้านี้ คุณจะพบชื่อโฮสต์ที่ระบุโดย Google Analytics โดยไปที่ผู้ชม → เทคโนโลยี → เครือข่าย และเปลี่ยนมิติข้อมูลหลักเป็นชื่อโฮสต์
นี่คือรายการประเภทของชื่อโฮสต์ที่คุณต้องการรวมไว้ใน รายงาน:
- โดเมน – นี่คือหลักชื่อโฮสต์ที่ใช้ระบุไซต์ของคุณบนเว็บและการอ้างอิงที่ถูกต้องเพียงหนึ่งเดียวจะผ่าน ดังนั้นจำเป็นต้องรวมไว้ คุณสามารถเพิกเฉยต่อโดเมนย่อยใดๆ ที่คุณสร้างขึ้นได้ เนื่องจากโดเมนหลักของคุณจะถูกครอบคลุม
- เครื่องมือ & บริการ – เป็นเครื่องมือที่คุณใช้บนเว็บไซต์ของคุณและอาจเชื่อมโยงกับบัญชีวิเคราะห์ของคุณเพื่อรวบรวมข้อมูลสำหรับแคมเปญ ซึ่งรวมถึงเครื่องมือต่างๆ เช่น ผู้ให้บริการการตลาดผ่านอีเมล เกตเวย์การชำระเงิน บริการแปลภาษา และระบบการจอง แต่เครื่องมือภายนอก เช่น YouTube คุณได้รวมเข้ากับการนับบัญชีของคุณด้วย
สร้างรายการ ของชื่อโฮสต์ที่ถูกต้องทั้งหมดที่เชื่อมโยงกับไซต์ของคุณตามคำแนะนำเหล่านี้ โดยต้องแน่ใจว่าชื่อแต่ละชื่อตรงกับลักษณะที่ปรากฏในช่องชื่อโฮสต์ ยกเว้นชื่อโฮสต์ต่อไปนี้:
- ชื่อโฮสต์ที่ไม่ได้ตั้งค่า
- สภาพแวดล้อมการพัฒนา เช่น localhost หรือโดเมนย่อยของสภาพแวดล้อมการแสดงละครของคุณ
- ไซต์เก็บถาวรและคัดลอกข้อมูล
- ชื่อโฮสต์ที่ดูถูกต้องแต่เป็นไซต์ที่คุณไม่ได้เป็นเจ้าของหรือเครื่องมือและบริการที่ไม่ได้รวมเข้ากับบัญชี Google Analytics ของคุณ สแปมเหล่านี้น่าจะถูกปลอมแปลงเป็นแหล่งที่มาที่ถูกต้อง
ตอนนี้คุณควรมีรายชื่อโฮสต์ที่ถูกต้องของแหล่งที่มาที่คุณจัดการหรือใช้กับบัญชี Analytics ของคุณ ตอนนี้คุณต้องสร้างนิพจน์ทั่วไปหรือ "regex" ที่รวมสิ่งเหล่านี้ทั้งหมดเข้าด้วยกัน
นิพจน์ทั่วไปคืออย่างถูกต้อง คลิกบันทึกเพื่อสร้างตัวกรองเมื่อเสร็จแล้ว
หากทุกอย่างเรียบร้อยดี ให้ทำตามขั้นตอนซ้ำกับมุมมองหลักของคุณ และลบเวอร์ชันทดสอบออก
กรองสแปมจากบอทโปรแกรมรวบรวมข้อมูล
นักส่งสแปมบางรายใช้บอทโปรแกรมรวบรวมข้อมูลเพื่อส่งการเข้าชมปลอมไปยังไซต์ของคุณ นอกจากนี้ เครื่องมือของบุคคลที่สามที่คุณใช้ รวมถึงการจัดการโครงการและเครื่องมือตรวจสอบไซต์ จะทำงานผ่านบอทรวบรวมข้อมูลหากคุณรวมไว้ในไซต์ของคุณ
คุณสามารถบล็อกสแปมประเภทนี้ได้โดยสร้างนิพจน์ที่คล้ายกัน แต่ ใช้ชื่อแหล่งที่มาแทนชื่อโฮสต์ ไปที่ Audience → Technology → Network อีกครั้ง และเพิ่ม Source เป็นมิติข้อมูลรอง
ต่อไปนี้เป็นนิพจน์ที่สร้างไว้ล่วงหน้าสองแบบที่คุณสามารถใช้ได้จากไซต์ของ Carlos Escalera Alonso หากคุณต้องการทำให้สิ่งต่างๆ ง่ายขึ้นด้วยตัวคุณเอง
นิพจน์ 1:
semalt|ranksonic|timer4web|anticrawler|dailyrank|sitevaluation|uptime(robot|bot|check|\-|\.com)|foxweber|:8888|mycheaptraffic|bestbaby\.life|(blogping|blogseo)\.xyz|(10best|auto|express|audit|dollars|success|top1|amazon|commerce|resell|99)\-?seo
นิพจน์ 2:
(artblog|howblog|seobook|merryblog|axcus|dotmass|artstart|dorothea|artpress|matpre|ameblo|freeseo|jimto|seo-tips|hazblog|overblog|squarespace|ronaldblog|c\.g456|zz\.glgoo|harriett)\.top|penzu\.xyz
คุณจะต้องตรวจสอบ URL ต้นทางของคุณ เครื่องมือใดส่งโปรแกรมรวบรวมข้อมูลไปยังไซต์ของคุณและสร้างนิพจน์ของคุณเองสำหรับพวกเขา
เมื่อคุณเพิ่มตัวกรองเหล่านี้ในการทดสอบและมุมมองหลักของคุณ ให้ใช้การยกเว้นเป็นประเภทตัวกรองและแหล่งที่มาของแคมเปญเป็นฟิลด์ตัวกรองของคุณ
ข้อคิดสุดท้าย
สแปมการอ้างอิงอาจสร้างความเสียหายให้กับการวิเคราะห์ไซต์ของคุณ อาจทำให้ดูเหมือนว่าคุณมี Hit และ Bounce Rate สูงกว่าที่คุณมี นั่นเป็นเหตุผลว่าทำไมการบล็อกสแปมการอ้างอิงในรายงานของคุณจึงเป็นเรื่องสำคัญ
อย่าลืมว่ามีมุมมองที่แตกต่างกันสามแบบสำหรับสตริงข้อความพิเศษสำหรับอธิบายรูปแบบการค้นหา รูปแบบการค้นหานั้นเป็นรายชื่อโฮสต์ที่ถูกต้องในกรณีนี้ Google Analytics จะใช้นิพจน์นี้เพื่อระบุชื่อโฮสต์ที่คุณต้องการรวมไว้ในข้อมูลของคุณหลังจากที่คุณสร้างตัวกรอง
ต่อไปนี้คือตัวอย่างลักษณะนิพจน์ของคุณควรมีลักษณะดังนี้:
yourdomain.com|examplehostname.com|anotherhostname
ท่อ
ดูสิ่งนี้ด้วย: DNS คืออะไร? คำแนะนำเกี่ยวกับระบบชื่อโดเมน