การรวบรวมข้อมูลและการจัดทำดัชนีคืออะไร
ภารกิจของเสิร์ชเอ็นจิ้นคือการจัดรายการอินเทอร์เน็ตทั้งหมด และพวกเขาจำเป็นต้องทำอย่างรวดเร็วและมีประสิทธิภาพ ขนาดและสเกลของอินเทอร์เน็ตทั้งหมดมีขนาดใหญ่มาก มีกี่เว็บไซต์และกี่หน้า ย้อนไปในปี 2008 Google บรรลุเป้าหมาย 1 ล้านล้านเพจที่มีการรวบรวมข้อมูลบนอินเทอร์เน็ต ภายในปี 2556 Google รวบรวมข้อมูลหน้าเว็บประมาณ 30 ล้านล้านหน้า น้อยกว่า 4 ปีต่อมา Google รู้จักหน้าเว็บ 130 ล้านล้านหน้า อัตราการเติบโตนั้นน่าทึ่ง และไม่ใช่เรื่องเล็กที่จะค้นพบหน้าเหล่านี้ทั้งหมด
หาก Google มีปัญหาในการรวบรวมข้อมูลหรือจัดทำดัชนีไซต์ของคุณ Google จะไม่ทำให้ไซต์นั้นเข้าสู่เครื่องมือค้นหา การทำความเข้าใจวิธีที่ Google รวบรวมข้อมูลและจัดทำดัชนีเว็บไซต์ทั้งหมดบนอินเทอร์เน็ตมีความสำคัญต่อการทำ SEO ของคุณ
คลานคืออะไร? โปรแกรมรวบรวมข้อมูลเว็บคืออะไร
การรวบรวมข้อมูลหมายถึงการติดตามลิงก์ในหน้าไปยังหน้าใหม่ และค้นหาและติดตามลิงก์ในหน้าใหม่ไปยังหน้าใหม่อื่นๆ ต่อไป
โปรแกรมรวบรวมข้อมูลเว็บเป็นโปรแกรมซอฟต์แวร์ที่ติดตามลิงก์ทั้งหมดในหน้าหนึ่งๆ นำไปสู่หน้าใหม่ และดำเนินกระบวนการนั้นต่อไปจนกว่าจะไม่มีลิงก์หรือหน้าใหม่ให้รวบรวมข้อมูลอีก
โปรแกรมรวบรวมข้อมูลเว็บมีชื่อต่างๆ กัน เช่น โรบ็อต สไปเดอร์ บอทเครื่องมือค้นหา หรือเรียกสั้นๆ ว่า "บอท" พวกเขาถูกเรียกว่าโรบ็อตเพราะพวกเขามีหน้าที่ที่ต้องทำ เดินทางจากลิงก์หนึ่งไปยังอีกลิงก์หนึ่ง และดักจับข้อมูลของแต่ละหน้า น่าเสียดาย หากคุณจินตนาการถึงหุ่นยนต์จริงๆ ที่มีแผ่นโลหะและแขน หุ่นยนต์เหล่านี้จะไม่เป็นเช่นนั้น โปรแกรมรวบรวมข้อมูลเว็บของ Google มีชื่อว่า Googlebot
กระบวนการรวบรวมข้อมูลจำเป็นต้องเริ่มต้นที่ไหนสักแห่ง Google ใช้ "รายการเริ่มต้น" เริ่มต้นของเว็บไซต์ที่เชื่อถือได้ซึ่งมีแนวโน้มที่จะเชื่อมโยงไปยังเว็บไซต์อื่นๆ จำนวนมาก พวกเขายังใช้รายการไซต์ที่พวกเขาเคยเห็นในการรวบรวมข้อมูลที่ผ่านมา เช่นเดียวกับแผนผังไซต์ที่ส่งโดยเจ้าของเว็บไซต์
การรวบรวมข้อมูลอินเทอร์เน็ตเป็นกระบวนการต่อเนื่องสำหรับเครื่องมือค้นหา มันไม่เคยหยุดเลยจริงๆ สิ่งสำคัญสำหรับเครื่องมือค้นหาในการค้นหาหน้าใหม่ที่เผยแพร่หรืออัปเดตหน้าเก่า พวกเขาไม่ต้องการเสียเวลาและทรัพยากรไปกับหน้าเว็บที่ไม่เหมาะสำหรับผลการค้นหา
Google ให้ความสำคัญกับการรวบรวมข้อมูลหน้าเว็บที่:
ยอดนิยม (เชื่อมโยงกับบ่อยครั้ง)
คุณภาพสูง
ปรับปรุงบ่อย
เว็บไซต์ที่เผยแพร่เนื้อหาใหม่ที่มีคุณภาพจะได้รับความสำคัญสูงกว่า
งบประมาณในการรวบรวมข้อมูลคืออะไร?
งบประมาณการรวบรวมข้อมูลคือจำนวนหน้าหรือคำขอที่ Google จะรวบรวมข้อมูลสำหรับเว็บไซต์ในช่วงระยะเวลาหนึ่ง จำนวนหน้าที่กำหนดขึ้นอยู่กับ: ขนาด ความนิยม คุณภาพ การอัปเดต และความเร็วของไซต์
หากเว็บไซต์ของคุณสิ้นเปลืองทรัพยากรในการรวบรวมข้อมูล งบประมาณในการรวบรวมข้อมูลของคุณจะลดลง และหน้าเว็บต่างๆ จะถูกรวบรวมข้อมูลน้อยลง ซึ่งส่งผลให้อันดับลดลง เว็บไซต์อาจทำให้ทรัพยากรของโปรแกรมรวบรวมข้อมูลเว็บเสียโดยไม่ได้ตั้งใจโดยให้บริการ URL ที่มีมูลค่าเพิ่มต่ำมากเกินไปแก่โปรแกรมรวบรวมข้อมูล ซึ่งรวมถึง “การนำทางแบบประกอบ, เนื้อหาที่ซ้ำกันในไซต์, หน้าแสดงข้อผิดพลาดแบบซอฟต์, หน้าที่ถูกแฮ็ก, พื้นที่และพร็อกซีที่ไม่มีที่สิ้นสุด, คุณภาพต่ำ และเนื้อหาที่เป็นสแปม”
Google ระบุเว็บไซต์ที่จะรวบรวมข้อมูลบ่อยขึ้น แต่ไม่อนุญาตให้เว็บไซต์จ่ายเงินสำหรับการรวบรวมข้อมูลที่ดีขึ้น เว็บไซต์สามารถเลือกไม่ใช้การรวบรวมข้อมูลหรือจำกัดการรวบรวมข้อมูลบางส่วนของไซต์ด้วยคำสั่งในไฟล์ robots.txt กฎเหล่านี้บอกโปรแกรมรวบรวมข้อมูลเว็บของเครื่องมือค้นหาว่าส่วนใดของเว็บไซต์ที่ได้รับอนุญาตให้รวบรวมข้อมูลและส่วนใดที่ไม่อนุญาตให้รวบรวมข้อมูล ระวังให้มากกับ robots.txt เป็นเรื่องง่ายที่จะบล็อก Google จากทุกหน้าในเว็บไซต์โดยไม่ตั้งใจ คำสั่งไม่อนุญาตตรงกับเส้นทาง URL ทั้งหมดที่ขึ้นต้นด้วยเส้นทางที่ระบุ:
ดูหน้าสนับสนุนของ Google สำหรับ robots.txt หากคุณต้องการความช่วยเหลือเพิ่มเติมเกี่ยวกับการสร้างกฎเฉพาะ
คำสั่งไม่อนุญาตของ robots.txt จะบล็อกเฉพาะการรวบรวมข้อมูลหน้าเว็บ เท่านั้น URL ยังคงสามารถจัดทำดัชนีได้หาก Google พบลิงก์ไปยังหน้าที่ไม่ได้รับอนุญาต Google สามารถใส่ URL และ anchor text ของลิงก์ไปยังหน้านั้นในผลการค้นหาได้ แต่จะไม่มีเนื้อหาของหน้านั้น
หากคุณไม่ต้องการให้หน้าเว็บรวมอยู่ในผลการค้นหาของ Google คุณต้องเพิ่มแท็ก noindex ลงในหน้านั้น (และอนุญาตให้ Google เห็นแท็กนั้น) แนวคิดนี้แสดงให้เราเห็นถึงความแตกต่างระหว่างการรวบรวมข้อมูลและการจัดทำดัชนี
การจัดทำดัชนีคืออะไร?
การทำดัชนีคือการจัดเก็บและจัดระเบียบข้อมูลที่พบในหน้าเว็บ บอทแสดงโค้ดบนหน้าในลักษณะเดียวกับที่เบราว์เซอร์ทำ จัดทำแคตตาล็อกเนื้อหา ลิงก์ และข้อมูลเมตาทั้งหมดบนเพจ
การทำดัชนีต้องใช้ทรัพยากรคอมพิวเตอร์จำนวนมหาศาล และไม่ใช่แค่การจัดเก็บข้อมูลเท่านั้น ต้องใช้ทรัพยากรคอมพิวเตอร์จำนวนมหาศาลเพื่อแสดงหน้าเว็บหลายล้านหน้า คุณอาจสังเกตเห็นสิ่งนี้หากคุณเปิดแท็บเบราว์เซอร์มากเกินไป!
การเรนเดอร์คืออะไร?
การแสดงผลคือการตีความ HTML, CSS และจาวาสคริปต์บนหน้าเพื่อสร้างการแสดงภาพของสิ่งที่คุณเห็นในเว็บเบราว์เซอร์ของคุณ เว็บเบราว์เซอร์แสดงโค้ดลงในหน้าเว็บ
การแสดงโค้ด HTML ต้องใช้พลังการประมวลผลของคอมพิวเตอร์ หากเพจของคุณใช้จาวาสคริปต์ในการแสดงเนื้อหาของเพจ จะต้องมีการประมวลผลจำนวนมหาศาล แม้ว่า Google จะรวบรวมข้อมูลและแสดงหน้าจาวาสคริปต์ได้ แต่การเรนเดอร์ JS จะไปที่คิวการจัดลำดับความสำคัญ ขึ้นอยู่กับความสำคัญของหน้า อาจใช้เวลาสักครู่เพื่อไปยังหน้านั้น หากคุณมีเว็บไซต์ขนาดใหญ่จริงๆ ที่ต้องใช้จาวาสคริปต์ในการแสดงเนื้อหาบนหน้า อาจใช้เวลานานในการจัดทำดัชนีหน้าใหม่หรือหน้าอัปเดต ขอแนะนำให้ให้บริการเนื้อหาและลิงก์ใน HTML แทนจาวาสคริปต์หากเป็นไปได้
การวิเคราะห์ระดับบล็อก (การแบ่งส่วนหน้า)
การแบ่งส่วนหน้าหรือการวิเคราะห์ระดับบล็อกช่วยให้เครื่องมือค้นหาเข้าใจส่วนต่างๆ ของหน้า: การนำทาง โฆษณา เนื้อหา ส่วนท้าย ฯลฯ จากจุดนี้ อัลกอริทึมสามารถระบุได้ว่าส่วนใดของหน้าที่มีข้อมูลที่สำคัญที่สุดหรือเนื้อหาหลัก . สิ่งนี้ช่วยให้เครื่องมือค้นหาเข้าใจว่าหน้านั้นเกี่ยวกับอะไร และไม่สับสนกับสิ่งอื่นที่อยู่รอบๆ
Google ยังใช้ความเข้าใจนี้เพื่อลดทอนประสบการณ์คุณภาพต่ำ เช่น โฆษณามากเกินไปในหน้าหนึ่งๆ หรือมีเนื้อหาครึ่งหน้าบนไม่เพียงพอ
เอกสารการวิจัยทางเทคนิคที่เผยแพร่โดย Microsoft สรุปว่าอัลกอริทึมสามารถเข้าใจส่วนต่าง ๆ บนเว็บเพจได้อย่างไร
การแบ่งส่วนหน้ายังมีประโยชน์สำหรับการวิเคราะห์ลิงก์
ตามธรรมเนียมแล้วลิงก์ต่างๆ ในหน้าจะถือว่าเหมือนกัน สมมติฐานพื้นฐานของการวิเคราะห์ลิงก์คือหากมีลิงก์ระหว่างหน้าสองหน้า แสดงว่ามีความสัมพันธ์บางอย่างระหว่างหน้าทั้งหมดทั้งสองหน้า แต่ในกรณีส่วนใหญ่ ลิงก์จากหน้า A ไปยังหน้า B เป็นการระบุว่าอาจมีความสัมพันธ์บางอย่างระหว่างบางส่วนของหน้า A และบางส่วนของหน้า B
การวิเคราะห์ประเภทนี้ทำให้ลิงก์ตามบริบทภายในบล็อกเนื้อหาขนาดใหญ่มีน้ำหนัก (หรือคุณค่า) มากกว่าลิงก์ที่ปรากฏในการนำทาง ส่วนท้าย หรือแถบด้านข้าง ความเกี่ยวข้องของลิงก์สามารถตัดสินได้จากสิ่งที่อยู่รอบๆ ลิงก์บนหน้าและตำแหน่งที่พบบนหน้านั้น
Google ยังมีสิทธิบัตรเกี่ยวกับการแบ่งส่วนหน้าโดยดูที่ช่องว่างทางสายตาหรือพื้นที่สีขาวในหน้าที่แสดง ตัวอย่างเหล่านี้แสดงให้เห็นว่าเครื่องมือค้นหาสามารถทำอะไรได้บ้างด้วยอัลกอริทึมที่ซับซ้อน
การรวบรวมข้อมูลและการจัดทำดัชนีแตกต่างกันอย่างไร
การรวบรวมข้อมูลคือการค้นพบหน้าและลิงก์ที่นำไปสู่หน้าอื่นๆ การทำดัชนีคือการจัดเก็บ วิเคราะห์ และจัดระเบียบเนื้อหาและการเชื่อมต่อระหว่างเพจ มีบางส่วนของการจัดทำดัชนีที่ช่วยแจ้งให้ทราบว่าเครื่องมือค้นหารวบรวมข้อมูลอย่างไร
คุณทำอะไรกับข้อมูลที่จัดระเบียบได้บ้าง
Google กล่าวว่าดัชนีการค้นหาของพวกเขา “มีหน้าเว็บหลายแสนล้านหน้าและมีขนาดมากกว่า 100,000,000 กิกะไบต์” กระบวนการจัดทำดัชนีจะระบุทุกคำในหน้าและเพิ่มหน้าเว็บในรายการสำหรับทุกคำหรือวลีที่มี มันเหมือนไส้ติ่งยักษ์ เครื่องมือค้นหาจะจดบันทึกสัญญาณที่พวกเขาพบ เงื่อนงำบริบท ลิงก์ ข้อมูลพฤติกรรม และพิจารณาว่าทั้งหน้ามีความเกี่ยวข้องกันเพียงใดสำหรับแต่ละคำที่อยู่ในนั้น
กราฟความรู้
Google ใช้ฐานข้อมูลขนาดใหญ่เพื่อสร้างกราฟความรู้ ใช้ข้อมูลที่พบเพื่อแมปเอนทิตีหรือสิ่งต่างๆ ข้อเท็จจริงเชื่อมโยงกับสิ่งต่าง ๆ และเชื่อมโยงระหว่างสิ่งต่าง ๆ ภาพยนตร์ประกอบด้วยตัวละครที่เชื่อมโยงกับหนังสือที่เขียนโดยผู้แต่งที่มีครอบครัวและสายสัมพันธ์อื่นๆ เป็นต้น ในปี 2555 Google กล่าวว่ามีวัตถุมากกว่า 500 ล้านชิ้นและข้อเท็จจริงมากกว่า 3.5 พันล้านรายการเกี่ยวกับความสัมพันธ์ระหว่างวัตถุ ข้อเท็จจริงที่รวบรวมและแสดงสำหรับแต่ละเอนทิตีนั้นขับเคลื่อนโดยประเภทการค้นหาที่ Google เห็นสำหรับสิ่งต่างๆ
นอกจากนี้ กราฟความรู้ยังช่วยขจัดความสับสนระหว่างสิ่งต่างๆ ที่มีชื่อเดียวกันได้อีกด้วย การค้นหา "ทัชมาฮาล" อาจเป็นคำขอข้อมูลเกี่ยวกับสิ่งมหัศจรรย์ของโลกทางสถาปัตยกรรม หรืออาจเป็นสำหรับคาสิโนทัชมาฮาลที่ปิดให้บริการแล้ว หรืออาจเป็นร้านอาหารอินเดียในท้องถิ่นข้างถนน
การค้นหาการสนทนา
นานมาแล้ว เมื่อ Google เริ่มต้นขึ้นครั้งแรก พวกเขาแสดงผลการค้นหาที่มีคำที่มีคนค้นหาเสมอ ผลการค้นหาเป็นเพียงการจับคู่คำหลักที่ค้นหากับคำหลักเดียวกันที่พบในเอกสารบนอินเทอร์เน็ต ไม่เข้าใจความหมายของข้อความค้นหา ดังนั้นจึงเป็นเรื่องยากสำหรับ Google ที่จะตอบคำถามในรูปแบบของคำถาม ในปี 1999 เราเคยชินกับการใช้ข้อความค้นหาของเราเป็นคำหลักเพื่อให้ได้ผลลัพธ์ที่น่าพอใจ แต่นั่นก็เปลี่ยนไปในช่วงหลายปีที่ผ่านมา
Google ลงทุนกับอัลกอริทึมการประมวลผลภาษาธรรมชาติเพื่อทำความเข้าใจว่าคำต่างๆ ปรับเปลี่ยนซึ่งกันและกันอย่างไร และข้อความค้นหามีความหมายอย่างไรนอกเหนือจากการจับคู่คำเท่านั้น
ในปี 2012 Google ได้เปิดตัวความสามารถ "การค้นหาเชิงสนทนา" ซึ่งเป็นไปได้โดยกราฟความรู้ ในปี 2013 Google ได้เปิดตัวอัลกอริทึม Hummingbird ซึ่งเป็นการปรับปรุงครั้งใหญ่ที่ทำให้ Google สามารถประมวลผลความหมายหรือความหมายของแต่ละคำในทุกคำค้นหา
ความสำคัญของการรวบรวมข้อมูลและการจัดทำดัชนีสำหรับเว็บไซต์ของคุณ
อย่าปิดกั้นเว็บไซต์ของคุณจาก Google โดยไม่ได้ตั้งใจ
ตรวจสอบและแก้ไขข้อผิดพลาดบนเว็บไซต์ของคุณ
ตรวจสอบดัชนีของ Google ตรวจสอบให้แน่ใจว่าหน้าเว็บของคุณปรากฏตามที่คุณต้องการ
นี่คือจุดเริ่มต้นของการเพิ่มประสิทธิภาพเครื่องมือค้นหาของคุณ หาก Google ไม่สามารถรวบรวมข้อมูลเว็บไซต์ของคุณ คุณจะไม่ถูกรวมไว้ในผลการค้นหาใดๆ อย่าลืมตรวจสอบ robots.txt การตรวจสอบ SEO ทางเทคนิคของเว็บไซต์ของคุณควรเปิดเผยปัญหาอื่น ๆ เกี่ยวกับความสามารถในการเข้าถึงโปรแกรมรวบรวมข้อมูลเว็บของเครื่องมือค้นหา
หากเว็บไซต์ของคุณมีข้อผิดพลาดมากเกินไปหรือหน้าคุณภาพต่ำ Google อาจเข้าใจว่าไซต์นั้นเป็นหน้าขยะที่ไร้ประโยชน์ ข้อผิดพลาดในการเข้ารหัส การตั้งค่า CMS หรือหน้าที่ถูกแฮ็กสามารถส่ง Googlebot ไปสู่เส้นทางของหน้าคุณภาพต่ำได้ เมื่อคุณภาพต่ำมีค่ามากกว่าเพจคุณภาพสูงบนเว็บไซต์ อันดับการค้นหาก็จะได้รับผลกระทบ
วิธีตรวจสอบปัญหาการรวบรวมข้อมูลและการจัดทำดัชนี
ค้นหา Google
คุณสามารถดูวิธีที่ Google จัดทำดัชนีเว็บไซต์ของคุณด้วยคำสั่ง “site:” ซึ่งเป็นโอเปอเรเตอร์การค้นหาพิเศษ ป้อนสิ่งนี้ลงในช่องค้นหาของ Google เพื่อดูหน้าเว็บทั้งหมดที่จัดทำดัชนีไว้ในเว็บไซต์ของคุณ:
ไซต์:yourdomain.com
คุณสามารถตรวจหาหน้าเว็บทั้งหมดที่ใช้ไดเรกทอรี (หรือเส้นทาง) เดียวกันบนไซต์ของคุณ หากคุณรวมสิ่งนั้นไว้ในคำค้นหา:
คุณสามารถรวม “site:” กับ “inurl:” และใช้เครื่องหมายลบเพื่อลบการจับคู่เพื่อให้ได้ผลลัพธ์ที่ละเอียดยิ่งขึ้น
ตรวจสอบว่าชื่อเรื่องและคำอธิบายจัดทำดัชนีในลักษณะที่ให้ประสบการณ์ที่ดีที่สุด ตรวจสอบให้แน่ใจว่าไม่มีหน้าเว็บแปลก ๆ ที่คาดไม่ถึงหรือมีการจัดทำดัชนีที่ไม่ควร
คอนโซลการค้นหาของ Google
หากคุณมีเว็บไซต์ คุณต้องยืนยันเว็บไซต์ของคุณกับ Google Search Console ข้อมูลที่ให้ไว้ที่นี่เป็นสิ่งล้ำค่า
Google จัดทำรายงานเกี่ยวกับประสิทธิภาพการจัดอันดับการค้นหา: การแสดงผลและการคลิกตามหน้าเว็บ ประเทศ หรือประเภทอุปกรณ์ ข้อมูลสูงสุด 16 เดือน ภายใต้รายงานการครอบคลุมของดัชนี คุณจะพบข้อผิดพลาดใดๆ ที่ Google พบ มีรายงานที่เป็นประโยชน์อื่นๆ อีกมากมายที่เกี่ยวข้องกับข้อมูลที่มีโครงสร้าง ความเร็วไซต์ และวิธีที่ Google จัดทำดัชนีเว็บไซต์ของคุณ สามารถดูรายงานสถิติการรวบรวมข้อมูลได้ในรายงานเดิม (สำหรับตอนนี้) ข้อมูลนี้จะช่วยให้คุณทราบวิธีการที่ Google รวบรวมข้อมูลเว็บไซต์ของคุณเมื่อเวลาผ่านไป เร็วหรือช้า มีหลายหน้าหรือน้อย
ใช้โปรแกรมรวบรวมข้อมูลเว็บ
ลองใช้โปรแกรมรวบรวมข้อมูลเว็บเพื่อทำความเข้าใจว่าเครื่องมือค้นหารวบรวมข้อมูลเว็บไซต์ของคุณอย่างไร มีหลายตัวเลือกให้ใช้งานฟรี Screaming Frog เป็นหนึ่งในโปรแกรมยอดนิยม มีอินเทอร์เฟซที่ยอดเยี่ยม ฟีเจอร์มากมาย และอนุญาตให้รวบรวมข้อมูลได้ถึง 500 หน้าฟรี Sitebulb เป็นอีกตัวเลือกที่ยอดเยี่ยมสำหรับโปรแกรมรวบรวมข้อมูลเว็บที่มีคุณสมบัติครบถ้วนพร้อมวิธีการแสดงข้อมูลที่ชัดเจนยิ่งขึ้น Link Sleuth ของ Xenu เป็นโปรแกรมรวบรวมข้อมูลเว็บรุ่นเก่า แต่ใช้งานได้ฟรี Xenu ไม่มีฟีเจอร์มากมายที่จะช่วยระบุปัญหา SEO แต่สามารถรวบรวมข้อมูลเว็บไซต์ขนาดใหญ่ได้อย่างรวดเร็วและตรวจสอบรหัสสถานะและหน้าใดที่เชื่อมโยงไปยังหน้าอื่น ๆ
การวิเคราะห์บันทึกเซิร์ฟเวอร์
เมื่อพูดถึงการทำความเข้าใจวิธีที่ Googlebot รวบรวมข้อมูลเว็บไซต์ของคุณ ไม่มีอะไรดีไปกว่าบันทึกของเซิร์ฟเวอร์ เว็บเซิร์ฟเวอร์สามารถกำหนดค่าให้บันทึกไฟล์บันทึกที่มีทุกคำขอหรือการเข้าชมโดยตัวแทนผู้ใช้ใดๆ ซึ่งรวมถึงผู้ที่ขอหน้าเว็บผ่านเบราว์เซอร์และโปรแกรมรวบรวมข้อมูลเว็บใดๆ เช่น Googlebot คุณจะไม่ได้รับข้อมูลเกี่ยวกับวิธีที่โปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาพบเว็บไซต์ของคุณจากแอปพลิเคชันการวิเคราะห์เว็บ เช่น Google Analytics เนื่องจากโดยทั่วไปโปรแกรมรวบรวมข้อมูลเว็บจะไม่เริ่มการทำงานของแท็กการวิเคราะห์จาวาสคริปต์ มิเช่นนั้นจะถูกกรองออก
การวิเคราะห์หน้าเว็บที่ Google กำลังรวบรวมข้อมูลนั้นมีประโยชน์มากในการทำความเข้าใจว่าหน้าเว็บเหล่านั้นกำลังรวบรวมข้อมูลหน้าเว็บที่สำคัญที่สุดของคุณหรือไม่ การจัดกลุ่มเพจตามประเภทจะเป็นประโยชน์ เพื่อดูว่าแต่ละประเภทเพจมีการรวบรวมข้อมูลมากน้อยเพียงใด คุณอาจจัดกลุ่มหน้าบล็อก หน้าเกี่ยวกับ หน้าหัวข้อ หน้าผู้เขียน และหน้าค้นหา หากคุณเห็นการเปลี่ยนแปลงครั้งใหญ่ในประเภทหน้าเว็บที่มีการรวบรวมข้อมูล หรือการกระจุกตัวอย่างมากในประเภทหน้าเดียว (ทำให้ผู้อื่นเสียหาย) อาจบ่งชี้ถึงปัญหาการรวบรวมข้อมูลที่ควรได้รับการตรวจสอบ รหัสสถานะข้อผิดพลาดที่พุ่งสูงขึ้นยังบ่งบอกถึงปัญหาการรวบรวมข้อมูลที่ชัดเจนอีกด้วย
“เทคโนโลยีใด ๆ ที่ก้าวหน้าเพียงพอนั้นแยกไม่ออกจากเวทมนตร์” - Arthur C. Clarke
ความสามารถในการรวบรวมข้อมูลอินเทอร์เน็ตทั้งหมดและค้นหาการอัปเดตอย่างรวดเร็วเป็นความสามารถทางวิศวกรรมที่เหลือเชื่อ วิธีที่ Google เข้าใจเนื้อหาของหน้าเว็บ การเชื่อมต่อ (ลิงก์) ระหว่างหน้า และความหมายของคำจริงๆ อาจดูเป็นเรื่องมหัศจรรย์ แต่ทุกอย่างขึ้นอยู่กับคณิตศาสตร์ของภาษาศาสตร์เชิงคำนวณและการประมวลผลภาษาธรรมชาติ แม้ว่าเราอาจไม่เข้าใจอย่างสมบูรณ์เกี่ยวกับคณิตศาสตร์และวิทยาศาสตร์ขั้นสูงนี้ แต่เราสามารถรับรู้ความสามารถได้ ด้วยการรวบรวมข้อมูลและจัดทำดัชนีอินเทอร์เน็ต Google สามารถได้รับความหมายและคุณภาพจากการวัดผลและบริบท
แหล่งที่มา:
Comments
Post a Comment