จะหลีกเลี่ยงปัญหาเนื้อหาซ้ำสำหรับ Google ได้อย่างไร
เผยแพร่แล้ว: 2021-11-01เนื้อหาที่ซ้ำกันในหน้ามีหลายอย่างเหมือนกันกับการใช้งบประมาณมากเกินไป เฉพาะในกรณีนี้เรากำลังพูดถึงการลดลงของ "งบประมาณความน่าเชื่อถือ" ในเว็บไซต์ของหุ่นยนต์ค้นหา ปัญหานี้เกี่ยวข้องกับเจ้าของเว็บไซต์จำนวนมาก เนื่องจากปัญหาดังกล่าวสามารถปรากฏได้แม้อยู่ข้างหลัง หลังจากอ่านบางอย่างเกี่ยวกับปัญหาเนื้อหาที่ซ้ำกัน ไซต์ของคุณกลายเป็นระเบิดเวลา Tick Tock บนนาฬิกาและการลงโทษของ Google กำลังรอคุณอยู่
น่าเศร้าแต่จริง มีประมาณ 25-30% ของเนื้อหาที่ซ้ำกันบนเว็บ อดีต Googler Matt Cutts ถือมุมมองนี้ แม้ว่าเนื้อหาที่ซ้ำกันอาจทำให้คุณประสบปัญหาในการเพิ่มประสิทธิภาพเครื่องมือค้นหา แต่นั่นไม่ใช่ทั้งหมดที่น่าทึ่ง มีวิธีแก้ไข — อ่านบทความนี้และเรียนรู้วิธีหลีกเลี่ยงปัญหาเนื้อหาซ้ำสำหรับ Google
- เนื้อหาที่ซ้ำกันคืออะไร?
- ข้อเท็จจริงเกี่ยวกับเนื้อหาที่ซ้ำกัน
- มีเนื้อหาประเภทใดบ้าง
- รหัสคืออะไร?
- หน้า HTTPS
- ระบบจัดการเนื้อหาสร้างเนื้อหาที่ซ้ำกัน
- หน้าสำหรับการพิมพ์หรือตัวเลือกการเรียงลำดับหลายรายการ
- ทำซ้ำเนื้อหาในบล็อกและระบบการเก็บถาวร
- เนื้อหาซ้ำที่ผู้ใช้สร้างขึ้น (โพสต์ซ้ำ ฯลฯ)
- บทสรุป
เนื้อหาที่ซ้ำกันคืออะไร?

เนื้อหาที่ซ้ำกันมี 3 ประเภทหลัก
- ซ้ำกันทุกประการ: URL สองรายการมีเนื้อหาเหมือนกันทั้งหมด
- เนื้อหาที่มีความแตกต่างเล็กน้อย เช่น ลำดับประโยค ภาพต่างกันเล็กน้อย เป็นต้น
- สำเนาข้ามโดเมน: มีสำเนาที่แน่นอนหรือมีการเปลี่ยนแปลงเล็กน้อยในหลายโดเมน
นอกจากนี้ ยังมีแนวคิดที่เกี่ยวข้องสองแนวคิดที่ Google ไม่ถือว่าเป็นเนื้อหาที่ซ้ำกัน แต่ผู้เผยแพร่โฆษณาและผู้เชี่ยวชาญด้าน SEO ที่มีประสบการณ์ไม่มากนักสามารถผสมเข้ากับเนื้อหาที่ซ้ำกันได้อย่างง่ายดาย
- เนื้อหาน้อย: เป็นหน้าที่มีเนื้อหาน้อยมาก ชุดของเพจที่สร้างขึ้นจากรายการที่อยู่ขององค์กร ซึ่งมีที่อยู่ 6,000 รายการ แต่แต่ละเพจมีที่อยู่เพียงรายการเดียว: เพียงไม่กี่บรรทัด
- เนื้อหาสไลซ์: หน้าที่แตกต่างกันเล็กน้อยจากหน้าอื่น ไซต์ขายรองเท้า Timberland ที่มีขนาด 38, 38.5, 39, 40, 41, 42 เป็นต้น หากไซต์มีหน้าแยกต่างหากสำหรับรองเท้าแต่ละขนาด จะมีความแตกต่างกันเล็กน้อยระหว่างหน้าเหล่านั้นทั้งหมด เอฟเฟกต์ดังกล่าว Google มองว่าเป็นเนื้อหาส่วน
Google ไม่ชอบเนื้อหาที่บางและหั่นเป็นชิ้นพอๆ กัน Google Panda สามารถตรวจจับเอฟเฟกต์เหล่านี้ได้ นั่นคือเหตุผลที่ผู้เผยแพร่โฆษณาควรหลีกเลี่ยงการสร้างเพจประเภทนี้
เนื้อหาที่ซ้ำกันสามารถเกิดขึ้นได้จากหลายสาเหตุ:
- การให้สิทธิ์ใช้งานเนื้อหาของไซต์ของคุณ
- ข้อบกพร่องในสถาปัตยกรรมของไซต์เนื่องจากระบบจัดการเนื้อหาไม่เหมาะสำหรับเครื่องมือค้นหา
- การมีอยู่ของการคัดลอกผลงาน
ในช่วงห้าปีที่ผ่านมา นักส่งสแปมที่ต้องการเนื้อหาเป็นพิเศษ ได้เริ่ม "ฉีก" เนื้อหาจากแหล่งที่ถูกต้อง ย้ายคำโดยใช้กระบวนการที่ซับซ้อนต่างๆ และวางข้อความผลลัพธ์บนหน้าเว็บเพื่อดึงดูดการดำเนินการค้นหาแบบ "หางยาว" และแสดงโฆษณาตามบริบทและจุดมุ่งหมายที่ไม่สุจริตอื่นๆ ดังนั้น ทุกวันนี้ผู้คนอยู่ในโลกของ "ปัญหาเนื้อหาซ้ำ" และ "บทลงโทษเนื้อหาซ้ำ"
แนะนำสำหรับคุณ: 5 วิธีที่เนื้อหาที่ดีสามารถเร่งความพยายามทางการตลาดของคุณ
ข้อเท็จจริงเกี่ยวกับเนื้อหาที่ซ้ำกัน

ตำแหน่งเนื้อหาที่ซ้ำกัน
หากเนื้อหาทั้งหมดอยู่บนไซต์ของคุณ เนื้อหานั้นซ้ำกันหรือไม่
ได้ เนื่องจากเนื้อหาที่ซ้ำกันสามารถเกิดขึ้นได้ทั้งในเว็บไซต์เดียวกันและเว็บไซต์ที่แตกต่างกัน
เปอร์เซ็นต์เนื้อหาที่ซ้ำกัน
เปอร์เซ็นต์ของเพจควรทำซ้ำเพื่อให้อยู่ภายใต้ตัวกรองเนื้อหาที่ซ้ำกัน ขออภัย เครื่องมือค้นหาไม่เคยเปิดเผยข้อมูลนี้ต่อสาธารณะ เนื่องจากจะส่งผลต่อความสามารถในการป้องกันปัญหา เปอร์เซ็นต์นี้เปลี่ยนแปลงตลอดเวลาสำหรับเครื่องยนต์ทั้งหมด บรรทัดล่างคือหน้าไม่จำเป็นต้องเหมือนกันจึงจะถือว่าซ้ำกันได้
อัตราส่วนรหัสต่อข้อความ
จะเกิดอะไรขึ้นหากโค้ดของคุณมีขนาดใหญ่มาก แต่มีองค์ประกอบ HTML ที่ไม่ซ้ำกันสองสามรายการบนหน้า Google จะไม่คิดว่าทุกหน้าซ้ำกันหรือ?
ไม่ เครื่องมือค้นหาไม่สนใจโค้ดของคุณ แต่สนใจเกี่ยวกับเนื้อหาในหน้าเว็บของคุณ ขนาดรหัสจะกลายเป็นปัญหาก็ต่อเมื่อมันโตเกินสัดส่วน
องค์ประกอบการนำทางต่ออัตราส่วนเนื้อหาที่ไม่ซ้ำกัน
ทุกหน้าในไซต์ของคุณมีแถบนำทางขนาดใหญ่ มีส่วนหัวและส่วนท้ายจำนวนมาก แต่มีเนื้อหาน้อยมาก Google จะไม่ถือว่าหน้าเหล่านี้ซ้ำกันทั้งหมดใช่หรือไม่
ไม่ Google พิจารณาองค์ประกอบการนำทางก่อนที่จะประเมินหน้าซ้ำด้วยซ้ำ
เนื้อหาที่ได้รับอนุญาต
คุณต้องการหลีกเลี่ยงปัญหาเนื้อหาที่ซ้ำกัน แต่จะทำอย่างไรถ้าคุณมีเนื้อหาจากแหล่งเว็บอื่นที่คุณได้รับอนุญาตให้แสดงต่อผู้เยี่ยมชม
ใช้ meta name = “robots” content=”noindex, follow” วางไว้ที่ส่วนหัวของหน้าของคุณ แล้วเครื่องมือค้นหาจะรู้ว่าเนื้อหานี้ไม่เหมาะสำหรับพวกเขา อีกทางเลือกหนึ่งคือการได้รับสิทธิพิเศษในการเป็นเจ้าของและเผยแพร่เนื้อหานั้น
มีเนื้อหาประเภทใดบ้าง

- เนื้อหาที่ไม่ซ้ำใคร เขียนขึ้นโดยบุคคล แตกต่างอย่างสิ้นเชิงจากการผสมตัวอักษร สัญลักษณ์ และคำอื่นๆ บนเว็บ และไม่ได้รับผลกระทบจากอัลกอริทึมการประมวลผลข้อความของคอมพิวเตอร์
- ส่วนย่อย คือเนื้อหาส่วนเล็กๆ (เช่น เครื่องหมายคำพูด) ที่ถูกคัดลอกและใช้งานซ้ำแล้วซ้ำอีก แทบไม่เป็นปัญหาสำหรับเครื่องมือค้นหา โดยเฉพาะอย่างยิ่งเมื่อรวมอยู่ในเอกสารขนาดใหญ่ที่มีเนื้อหาเฉพาะจำนวนมาก
- โรคงูสวัด เครื่องมือค้นหามองหากลุ่มวลีที่ค่อนข้างเล็ก (5-6 คำ) บนหน้าเว็บอื่นๆ หากเอกสารสองฉบับมีงูสวัดมากเกินไป เครื่องมือค้นหาอาจตีความเอกสารเหล่านั้นว่าเป็นเนื้อหาที่ซ้ำกัน
รหัสคืออะไร?

มีหลายวิธีในการสร้างเนื้อหาที่ซ้ำกัน สิ่งนี้อธิบายได้ว่าทำไมจึงมีมากเกินพอบนเว็บ เนื้อหาที่ซ้ำกันภายในต้องการกลวิธีเฉพาะเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดในแง่ของการเพิ่มประสิทธิภาพ พูดตามตรง หน้าที่ซ้ำกันคือหน้าที่ไม่มีคุณค่าต่อทั้งผู้ใช้และเครื่องมือค้นหา จากนั้นพยายามหลีกเลี่ยงปัญหานี้อย่างสมบูรณ์ ตรวจสอบให้แน่ใจว่ามีเพียงหนึ่ง URL ที่อ้างถึงแต่ละหน้า นอกจากนี้ ให้เปลี่ยนเส้นทาง 301 สำหรับ URL เก่าไปยัง URL ที่เหลือ ช่วยให้หุ่นยนต์ค้นหาเห็นการเปลี่ยนแปลงที่คุณทำโดยเร็วที่สุด และเก็บ "น้ำลิงก์" ที่หน้าลบไว้

หากเป็นไปไม่ได้ มีตัวเลือกอื่นมากมาย นี่คือบทสรุปของวิธีแก้ปัญหาที่ง่ายที่สุดสำหรับสถานการณ์ต่างๆ:
- คุณสามารถใช้ไฟล์ robots.txt เพื่อบล็อกสไปเดอร์ของเครื่องมือค้นหาไม่ให้รวบรวมข้อมูลผ่านหน้าไซต์ของคุณในเวอร์ชันที่ซ้ำกัน
- ใช้องค์ประกอบ rel=”canonical” ซึ่งเป็นวิธีแก้ปัญหาที่ดีที่สุดอันดับสองในการลบหน้าที่ซ้ำกัน
- ใช้ CODE <meta name=”robots” content=”noindex”> เพื่อสั่งเครื่องมือค้นหาไม่ให้แสดงหน้าที่ซ้ำกัน
อย่างไรก็ตาม โปรดทราบว่าหากคุณใช้ robots.txt เพื่อป้องกันการดูหน้าเว็บ การใช้ noindex หรือ nofollow บนหน้าเว็บนั้นไม่สมเหตุสมผล เนื่องจากแมงมุมไม่สามารถอ่านหน้าเว็บได้ ก็จะไม่เห็นเมตาแท็ก noindex หรือ nofollow เมื่อคำนึงถึงเครื่องมือเหล่านี้แล้ว ให้พิจารณาสถานการณ์เฉพาะบางประการของเนื้อหาที่ซ้ำกัน
คุณอาจชอบ: ทำไมการเขียนเนื้อหาจึงมีความสำคัญต่อแบรนด์และธุรกิจ
หน้า HTTPS

หากคุณใช้โปรโตคอล SSL (การแลกเปลี่ยนข้อมูลที่เข้ารหัสระหว่างเบราว์เซอร์และเว็บเซิร์ฟเวอร์ ซึ่งมักใช้สำหรับอีคอมเมิร์ซ) แสดงว่าไซต์ของคุณมีหน้าเว็บที่ขึ้นต้นด้วย HTTPS: (แทน HTTP:) ปัญหาเกิดขึ้นเมื่อลิงก์ในหน้า HTTPS ชี้ไปที่หน้าอื่นๆ ในเว็บไซต์โดยใช้ลิงก์สัมพัทธ์แทนลิงก์สัมบูรณ์ ตัวอย่างเช่น ลิงก์ไปยังหน้าแรกของคุณจะกลายเป็น https://www.YourDomain.com แทนที่จะเป็น http://www.YourDomain.com)
หากไซต์ของคุณมีปัญหานี้ คุณสามารถใช้ rel=”canonical” หรือการเปลี่ยนเส้นทาง 301 เพื่อแก้ไขได้ ทางเลือกอื่นคือเปลี่ยนลิงก์เป็นแบบสัมบูรณ์: http://www.YourDomain.com/content.html แทน /contenthtml) ซึ่งทำให้ชีวิตยากขึ้นเล็กน้อยสำหรับผู้ที่ขโมยเนื้อหาของคุณ
ระบบจัดการเนื้อหาสร้างเนื้อหาที่ซ้ำกัน

บางครั้งไซต์อาจมีหน้าเว็บที่เหมือนกันได้หลายเวอร์ชัน เกิดจากข้อจำกัดในระบบจัดการเนื้อหาบางระบบที่อ้างถึงเนื้อหาเดียวกันด้วย URL มากกว่าหนึ่งรายการ โดยปกติแล้วจะเป็นการทำซ้ำเพิ่มเติมโดยสิ้นเชิงซึ่งไม่มีค่าสำหรับผู้ใช้ การตัดสินใจที่ดีที่สุดคือการลบหน้าที่ซ้ำกันและทำการเปลี่ยนเส้นทาง 301 สำหรับหน้าที่นำออกไปยังหน้าที่เหลือ หากไม่ได้ผล ให้ลองวิธีอื่นๆ
หน้าสำหรับการพิมพ์หรือตัวเลือกการเรียงลำดับหลายรายการ

ไซต์จำนวนมากเสนอหน้าสำหรับการพิมพ์ที่ให้เนื้อหาเดียวกันแก่ผู้ใช้ในรูปแบบที่ดัดแปลงโดยเครื่องพิมพ์ ไซต์อีคอมเมิร์ซบางแห่งมีรายการสินค้าของตนหลายรายการ (ตามขนาด สี ยี่ห้อ และราคา) หน้าเหล่านี้มีค่าสำหรับผู้ใช้ แต่ไม่มีค่าสำหรับเครื่องมือค้นหา ดังนั้น พวกเขาคิดว่ามันเป็นเนื้อหาที่ซ้ำกัน ในสถานการณ์เช่นนี้ คุณสามารถสร้างสเปรดชีต CSS สำหรับการพิมพ์ได้
ทำซ้ำเนื้อหาในบล็อกและระบบการเก็บถาวร

บล็อกมีรูปแบบของตัวแปรที่น่าสนใจในประเด็นเนื้อหาที่ซ้ำกัน โพสต์บล็อกสามารถปรากฏในหน้าต่างๆ ได้หลายหน้า:
- หน้าเริ่มต้นของบล็อก
- หน้าลิงก์ถาวรสำหรับโพสต์นั้น
- หน้าเก็บถาวร;
- หน้าหมวดหมู่
สำเนาโพสต์แต่ละฉบับซ้ำกับสำเนาอื่น ๆ น้อยนักที่ผู้เผยแพร่จะพยายามจัดการกับปัญหาการปรากฏของโพสต์ทั้งในหน้าแรกของบล็อกและหน้าลิงก์ถาวร และดูเหมือนว่าเครื่องมือค้นหาจะรับมือกับปัญหานี้ได้ค่อนข้างดี อย่างไรก็ตาม การแสดงเฉพาะตัวอย่างโพสต์ในหน้าหมวดหมู่และหน้าเก็บถาวรอาจเหมาะสม
เนื้อหาซ้ำที่ผู้ใช้สร้างขึ้น (โพสต์ซ้ำ ฯลฯ)

ไซต์หลายแห่งใช้โครงสร้างเพื่อรับเนื้อหาที่ผู้ใช้สร้างขึ้น เช่น บล็อก ฟอรัม หรือกระดานข้อความ สิ่งเหล่านี้เป็นวิธีที่ยอดเยี่ยมในการพัฒนาเนื้อหาจำนวนมากด้วยต้นทุนที่ต่ำมาก ปัญหาคือผู้ใช้สามารถเผยแพร่เนื้อหาเดียวกันทั้งบนไซต์ของคุณและไซต์อื่นๆ หลายไซต์พร้อมกัน ซึ่งนำไปสู่ปัญหาเนื้อหาที่ซ้ำกัน ควบคุมได้ยาก แต่เพื่อลดปัญหาคุณสามารถดำเนินการดังนี้:
- คุณต้องมีนโยบายที่ชัดเจนที่จะแจ้งให้ผู้ใช้ทราบว่าเนื้อหาที่พวกเขามอบให้กับไซต์ของคุณควรไม่ซ้ำใครและไม่สามารถโพสต์บนเว็บไซต์อื่นได้ ไม่ต้องสงสัยเลยว่ามันยากที่จะได้รับสิ่งนี้ แต่มันจะช่วยให้คุณตระหนักถึงความคาดหวังของคุณ
- ขัดเกลาฟอรัมของคุณในแบบที่ไม่ซ้ำใครซึ่งจะต้องการเนื้อหาที่แตกต่างออกไป นอกจากฟิลด์ป้อนข้อมูลมาตรฐานแล้ว ให้เพิ่มฟิลด์เฉพาะบางฟิลด์ (แตกต่างจากไซต์อื่น) ซึ่งจะเป็นประโยชน์สำหรับผู้เยี่ยมชมไซต์ของคุณ
คุณอาจชอบ: วิธีขยาย SEO ของคุณด้วยเนื้อหาวิดีโอ
บทสรุป

ไม่ต้องกังวลมากเกินไปเกี่ยวกับเนื้อหาที่ซ้ำกัน มันมักจะไม่ใช่เรื่องใหญ่ Google ส่วนใหญ่รู้วิธีจัดการกับปัญหาต่างๆ เช่น หน้าต้นแบบหรือการอ้างอิงเนื้อหา นอกจากนี้ ผู้คนจำนวนมากประสบปัญหาเนื้อหาที่ซ้ำกัน บางครั้งรายการที่ซ้ำกันไม่ปรากฏต่อใครในที่ที่พวกเขาคาดหวัง ดังนั้นคุณควรตรวจสอบไซต์เพื่อหารายการเหล่านี้อยู่เสมอ เพื่อป้องกันสิ่งเหล่านี้ คุณต้องสร้างเนื้อหาที่ไม่ซ้ำกันสำหรับแต่ละหน้า
บทความนี้เขียนโดย Isabelle Jordan Isabelle เป็นนักข่าวสายธุรกิจและการตลาดที่บริษัทประกันภัย ektatraveling.com เธอเขียนให้กับพอร์ทัลข่าวต่างๆ และบล็อกเฉพาะเรื่องที่ช่วยให้เธอเป็นหัวใจสำคัญของข่าวการเดินทางและการประกันภัย งานดังกล่าวเปิดโอกาสให้เธอเขียนบทความในหัวข้อที่เกี่ยวข้องมากที่สุดในปัจจุบัน