วันเสาร์ที่ 4 ธันวาคม พ.ศ. 2553

เปิดระบบการทำงานของ google

Photobucket

ปัจจุบัน search engine ที่มีส่วนแบ่งในตลาดสูงสุดอย่าง google จัดอยู่ใน search engine ประเภท crawler-based search engine ซึ่งเน้นระบบการทำงานด้านจัดเก็บข้อมูลและประมวลผลการค้นหาเต็มรูปแบบ นอกจากนี้ยังมี "ค่าคะแนนความเชื่อถือของหน้าเพจ" หรือ google pagerank การทำงานของ google แยกออกได้เป็น 3 ส่วนใหญ่ คือ
1. googlebots  เป็นโปรแกรมที่จะคอยไต่ไปตามลิงค์ และคอยเก็บข้อมูล หรือจะรับคำสั่งจากแม่ข่าย ให้ไปเก็บข้อมูลตามที่มีผู้มาลงทะเบียน
2. ระบบการจัดเก็บข้อมูลเอกสาร (index server) เป็นระบบการจัดเก็บข้อมูลจาก googlebots โดยข้อมูลส่วนใหญ่จะมากจาหน้าเพจ และไฟล์เอกสารต่าง โดยข้อมูลทั้งหมดทางระบบจะประมวลผลในการจัดอันดับการค้นหา
3. The query processor เป็นตัวประมวลผลรับคำสั่งจากช่องค้นหา (search box) โดยประมวลผลจากเอกสารที่ได้ index ไว้ เพื่อนำไปจัดอันดับแสดงผลการค้นหา

การลงทะเบียนที่อยู่ของเว็ปไซต์ เพื่อให้ googlebots เก็บข้อมูล
คุณสามารถลงทะเบียนเป็น URL ใหม่เพื่อให้มีการเก็บข้อมูล ได้ใน http://www.google.com/addurl.html
ระบบจะส่ง googlebots มาเก็บข้อมูลโดยตรง

0 ความคิดเห็น:

แสดงความคิดเห็น