Social Bookmarking Algorithms
ผมกล่าวถึง Social Bookmark มาไม่รู้กี่รอบต่อกี่รอบแล้ว อย่าพึ่งเบื่อนะครับ มันมีเรื่องให้ค้นคว้า และน่าศึกษากว่าระบบของ Search Engine เสียอีก ไม่งั้นจะถูกผสมรวมลงเป็นหนึ่งในหลักการของ Web 2.0 หรือครับ ทั้งที่ระบบของ Search Engine ยังคงอยู่ในหลักการของ Web 1.0 อยู่เลย ถ้าไม่พัฒนาไปอีก และไปอีก ซึ่งก็แน่นอนว่าทุกก้าวย่างของการพัฒนา ระบบ Algorithm ของ Search Engine ก็ย่อมที่จะเปลี่ยนแปลงไปเสมอ ยกตัวอย่างให้ดูง่ายๆ คือ ปรากฏการณ์ Google Sandbox Effect และ Google Update Florida ไงครับ ซึ่งเป็นของยักษ์ใหญ่แห่งวงการค้นหาอย่าง Google รายเดียวเท่านั้น แล้วถ้ารวม 3 รายเข้าไปล่ะ ลองคิดดูแล้วกันว่ามันจะเปลี่ยนแปลงไปมากแค่ไหน และไอ้ Sandbox Effect นี่ละครับ ผมไม่ชอบเอาเสียเลย ที่เป็นตัวกรองตัวหนึ่งที่อาจทำให้เว็บไซต์หรือ Blog ใหม่ๆ ติดอันดับในผลงานค้นหาได้ยาก ทั้งนี้แล้ว บางส่วนก็ต้องชมและยกนิ้วให้ สำหรับการป้องกัน Spam ได้ แต่ก็ทำให้ Blog ใหม่ๆแต่ดีๆ ตกไปเหมือนกัน
Google มีอิทธิพลต่อวงการอินเตอร์เน็ตพอสมควร บริการหลายๆ อย่างของ Google สร้างความประทับให้กับผู้ใช้อินเตอร์เน็ต จนกระทบกระทั่งไปถึงเจ้าพ่อซอร์ฟแวร์อย่าง Microsoft ถึงขนาดอดรนทนไม่ไหว ขอ Takeover Google ไปหลายครั้ง แต่จนแล้วจนรอด Google ก็ยังทานอำนาจ ยืนหยัดไหว ไม่ยอมสละบัลลังค์ให้ง่ายๆ เร่งพัฒนาระบบของตนต่อไป เปิดบริการใหม่ๆมาอย่างต่อเนื่อง ฝ่าย Microsoft และ Yahoo ก็ใช่ย่อย ยกทัพตามมาติดๆ เหมือนกัน สมรภูมิรบแห่งนี้ นับวันยิ่งทวีความดุเดือดขึ้นทุกวันๆ ถ้าดาบไม่หัก ปืนใหญ่ไม่ระเบิด มันต้องตายไปข้างใดข้างหนึ่งแน่ๆ ชาตินี้ครับ
หากจะว่าไปแล้วนั้น Search Engine ใช้สมการทางคณิตศาสตร์อันสลับซับซ้อน สร้าง Robots มาเก็บข้อมูลบนหน้าเอกสารเว็บไซต์ โดยไต่ไปตามเครือข่ายไยแมงมุม (WWW) มี Algorithm มาประมวลผลร่วม เพื่อให้แสดงผลการค้นหาอย่างครอบคลุมที่สุด และเรื่อง Algorithm นี่แหละครับ เป็นเรื่องยากต่อการทำความเข้าใจ ไม่มีใครรู้ คนรู้ก็เพียงแนวคิดความน่าจะเป็นเท่านั้น
โดยหลักการของการปรับแต่งเว็บไซต์หรือ Blog ให้ติดอันดับ ความสำคัญสูงสุดคือลิงค์ รองลงมาคือ จำนวน Keyword ที่ปรากฏบนเนื้อหา จากนั้นคือจำนวน Traffic UIP และ Domain Profile ทั้งนี้ไม่รวม Domain Name เพราะส่วนตัวคิดว่า เป็นตราสินค้าหรือ Brand เท่านี้ ส่วน Meta Tag นี้ ตัดทิ้งไปเลย เพราะ Search Engine นำมาพิจารณาประกอบเพื่อตรวจสอบว่าเว็บไซต์หรือ Blog นั้น เป็น Spam หรือไม่เท่านั้น ถึงแม้จะนำมาใช้ประกอบในหน้าแสดงผลค้นหา (Search Result) ก็ช่างเหอะ เพียงเขียนย่อหน้าแรกดีๆ ถึงแม้จะไม่มี Mata Tag แต่ Search Engine ก็จะดึงข้อมูลเหล่านี้ไปแสดงแทน เรื่องตัวอักษร หนา เอียง ขีดเส้นใต้ หรือพาดหัว (H1,H2,H3) นี้ ถ้าเราใช้ Blog Software อย่าง WordPress ทำ ก็ควรเน้นลงไปด้วย ล่ะกัน ถึงแม้จะมีผลน้อยแต่ก็ดีกว่าไม่ทำเลย

ที่ผมเอาเรื่องของ Search Engine มาเขียนร่วมกับ Social Bookmark ก็เพราะว่า ไม่อยากให้ละทิ้งหลักการนี้ไป SEO (Search Engine Optimization) ยังใช้ได้อีกนานครับ ตราบใดที่การมาของ Web 2.0 ยังไม่ส่งผลกับผู้ใช้อินเตอร์เน็ตมากมาย ผู้พัฒนาระบบเว็บไซต์ (Webmaster) ยังให้ความสนใจกับความสวยงาม และกราฟฟิกเพื่อแต่งเติมเว็บไซต์ มัวแต่ประกวดผลงานการออกแบบ ดีไซด์ โดยไม่คำนึงถึง W3C เลย อาจจะรู้หรือไม่รู้ว่า Web Browser เกือบทั้งหมด กำลังปรับตัวให้เข้ากันได้กับมาตรฐานเว็บไซต์ (W3C) แปลภาษา HTML แล้วแสดงผลออกมาได้ถูกต้อง เหมือนกันหมด ไม่ว่าจะใช้ Web Browser ของค่ายไหนเชื่อมต่อเข้าอินเตอร์เน็ต
เหมือนส่องไฟฉายที่แสงไฟมันริบหรี่ พอสลัวๆ ลงไปในบ่อน้ำ ที่ลึกๆ แม้ความเร็วของแสงจะเร็วเพียงใด ก็ไม่เห็นแม้ก้นบ่อได้ แล้วเราจะรู้ได้อย่างไรว่าที่ก้นบ่อนั้นมีน้ำหรือไม่ และอาจได้ยินเสียงกระซิบจากคนข้างๆ เบาๆ ว่า …จะส่องหาพระแสงอะไร เหมือนกับการเข้ามาของ Web 2.0 ถึงจะเข้มข้นร้อนแรงเพียงใด ถ้าขาดคนอุปถัมภ์ คอยผลักดัน มันก็คงมีแต่ชื่อ แล้วเราจะรู้ได้อย่างไร ว่ามันดีหรือมันแตกต่างกับปัจจุบันหรือไม่ อย่างไร (นอกเรื่อง เหลวไหล ไปใหญ่แล้วเรา)

วกกลับมาในเรื่องของ Social Bookmark หลังจากไปส่องดูก้นบ่อกันแล้ว พลังมวลชนอย่าง Social Bookmarking ที่ช่วยกันกลั่นกรอง คัดเนื้อหาที่ดีๆ มีคุณภาพขึ้นมาแสดง ต่างคนก็ต่างออกความเห็นส่วนตัวลงไป เรื่องไหนดี เรื่องไหนเด่น ก็ย่อมได้รับความน่าเชื่อถือตามมา ผลสุดท้าย คนที่ได้รับผลตอบแทนสูงสุด ก็คือคนเขียนเรื่องนั้นขึ้นมานั่นเอง ศัพท์อมตะอย่าง Content is King (เนื้อหาคือราชา) ยังคงใช้ได้อีกนานเท่านานครับ ส่วนศัพท์อย่าง Keyword Density (จำนวนคำที่ใช้ค้นหาปรากฏบ่อยๆบนหน้า Blog) เริ่มตกลงไปๆ และขอยกตัวอย่าง Social Bookmarking ที่ได้รับความนิยมในปัจจุบัน หน่อยล่ะกัน อาทิเช่น del.icio.us , Digg, Reddit, Netscape ครับ ใครยังไม่มี Social Bookmarking WordPress Plugin ติด Blog ก็พิจารณาเพิ่มนิดนะ ว่าจะติดมันสักหน่อยมั้ย

เมื่อ Search Engine มี Algorithm ฉันใด Social Bookmark ก็ย่อม Algorithm ด้วยฉันนั้น แต่ Algorithm ของ Social Bookmark มันน่าค้นหาและทำความรู้จักเป็นอย่างยิ่ง เพราะว่ามันมีภาษามนุษย์มาร่วมด้วย ไม่ใช้เพียงแค่ภาษาคอมพิวเตอร์อีกต่อไป ในที่นี้ก็เป็นเพียงแนวคิด ความน่าจะเป็นเท่านั้น และขอยกตัวอย่าง Algorithm ของ Digg, Reddit, Netscape ละกันครับ ว่ากันตามลำดับเลยนะครับ
1. Number of votes over time ถ้าเรื่องไหนดี ก็ย่อมได้รับความนิยมและได้รับคะแนนโหวต กลับมาเป็นเรื่องธรรมดา อยู่แล้ว ใช่ไหมล่ะครับ แต่ในที่นี้ พิจารณาลึกลงไปกว่านั้น คือเรื่องที่ได้รับคะแนนโหวตอย่างรวดเร็วจะมีค่ากว่าเรื่องที่ได้รับคะแนนโหวตแบบช้าๆ กินเวลานาน
2. Domain of link โดเมนนี้ มีเนื้อหาก่อนส่งเรื่องไปที่ Social Bookmarking หรือไม่ ถ้าไม่มีพิจารณาเป็น Spam ถ้ามีทำการตรวจสอบอีกทีว่าถูกส่งอัตโนมัติ หรือส่งเองด้วยมือ หรือถ้าพิจารณาดีๆ อาจเกี่ยวพันกับความเก่า-ใหม่ (อายุ) ของโดเมนแน่ๆ เลยครับ
3. Profile of submitter and voters ตรงนี้ ดูกันที่ข้อมูลคนส่งเรื่อง/โหวตเลยทีเดียว โดยพิจารณาอยู่ 4 หลักใหญ่ๆ คือ จำนวนเรื่อง/โหวต ที่ Profile นี้ ส่งเข้ามา/โหวตมาได้รับความนิยมเพียงใด เรื่องไหนไม่ได้รับความนิยม เรื่องไหนเป็น Spam ไม่เว้นแม้กระทั่งกลุ่มเพื่อน ของ Profile นี้ เลยครับ เรียกได้ว่าดูกันถึง Rate ของผู้ใช้เลยทีเดียว
4. Timing of submission มันน่าสนใจจริงๆ ส่วนนี้ ดูกันที่เวลาของเรื่องที่ส่งไปนั้นได้รับการยอมรับ รวดเร็ว เท่าไรกันเลยครับ
5. Similarity to other links (duplicate) ความคล้ายคลึงกันของเนื้อหาครับ
6. Source of votes ตรวจสอบว่าจำนวนโหวตมาจาก IP เดียวกันหรือไม่ อยู่ในเขตพื้นที่ ประเทศเดียวกัน หรือหลากหลาย เว้นแต่ Digg ไม่เอาส่วนนี้มาเกี่ยวนะครับ และอีกเรื่องคือมาจากกลุ่มผู้ใช้เดียวกันหรือหลากหลาย
7. Number of comments ตรวจสอบเรื่องนั้นได้รับการคอมเม็นต์กลับมามากน้อยเพียงใด Feedback เป็นอย่างไร
8. Number of views จำนวนคนสนใจเรื่องนี้ เปิดดูกันมากเท่าไร ผิดปกติหรือไม่
9. Down votes ออกเสียงไม่เห็นด้วย ส่วนนี้น่าจะไม่มีเพราะมันผิดมารยาทอย่างแรงเลยครับ ถ้าเรื่องไหนไม่ดี ระบบคำนวณจาก Algorithm อื่นๆ ก็เพียงพอแล้วครับ และเรื่องนั้นก็จะตกไปตามกระแสครับ
จากขุมพลังชุมชน Social Bookmarking ตรงนี้ ทำให้ Search Engine หวั่นๆ เหมือนกัน ว่าจะเข้าแทนที่ระบบ Search Engine ของตัวเองหรือไม่ จนทำให้ Yahoo ยอมเปิดบริการอย่าง My Web 2.0 เพื่อเสริมทัพอีกกองพันหนึ่ง ซึ่งจัดได้ว่าเป็น Social Network ที่น่าสนใจ และมีบริการ Social Search เติมเต็มอีกทีหนึ่ง ว่ากันว่าผลการค้นหาออกมาเป็น Personal Result เลยทีเดียว ทางด้าน Microsoft ที่กำลังยุ่งยากกับการสร้าง Brand ใหม่ อย่าง Live อยู่ ไม่ขอพูดถึง ส่วน Google นั้นไม่ยอมล้าง่ายๆ หลังไมค์กำลังซุ่มพัฒนา Search Engine ตัวใหม่ คือ Searchmash ตอนนี้กำลังประคบประหงมกันอยู่ แต่แปลกก็ตรงที่ Google พยายามสลัดคราบ Google Brand ออกไป สำหรับ Searchmash นั้นอาจเรียกได้ว่า กระโดดเข้ามาเป็น Web 2.0 แบบเต็มภาคภูมิเลยก็ว่าได้นะครับ เพราะผสมผสานเทคโนโลยีใหม่อย่าง AJAX ลงไป พร้อมทั้งให้ผู้ใช้สามารถออกความเห็นเกี่ยวกับผลการค้นหาได้ว่า ผลการค้นหาออกมาตรงความต้องการ หรือไม่มากน้อยเพียงไร แล้ว iDayBlog ล่ะ ตอนนี้กำลังทำอะไร iDayBlog เปิดตำราพิชัยสงคราม วางแผนกลศึกอยู่ครับ รอโอกาสจากความเหนื่อยล้าของ 3 ยักษ์ใหญ่ เมื่อเวลานั้นมาถึง จะตลบหลังด้วยแม่ไม้มวยไทย ทีนี้จะได้รู้ว่าเมืองไทยมีดีครับ
หมายเหตุ ภาพประกอบจากอินเตอร์เน็ต
เรื่องที่เกี่ยวข้อง
เหอๆ
ๆๆๆ ชักเริ่มน่ากลัวแหะ สงสัยต้องลาออกมาเขียนบล็อกแล้วมั๊งเนี่ยะ อิอิอิ ยาวดีครับอ่านจนเคลิ้มไปเลยเหอๆ
ๆๆ นับวันคุณ iDayBlog จะเขียนเรื่องราวได้ดีขึ้นเรื่อย ๆ เลยหนะครับสุดยอดมาก ขยันอัพเดทอีกตะหาก เยี่ยม
ครับ อ้อ..อย่าลืมไปลงทะเบียนที่ http://www.sakavan.net หนะครับเดี๋ยวจะหาว่าไม่บอกครับ อิอิอิ
กลัวอะไรครับ Make Many เนื้อหาใน Blog นี้จะเริ่มดุเดือดขึ้นทุกวัน หรืออาจโม้มากไปทุกวันก็ได้ครับ ผมพยายามให้มันออกมาดีหน่อยครับ อยากเขียนบทความยาวๆด้วย ซึ่งกว่าจะได้บทความใหม่แต่ละเรื่อง ก็กินเวลาหลายวันเหมือนกัน คิด Concept ใหม่ไปเรื่อยๆ บทความเก่าไม่เสร็จก็เขียนบทความใหม่ไปเรื่อย พอคิดได้ก็กลับมาเขียนอันเดิมต่อ สับสนพอสมควรครับ ตอนนี้ก็มีเรื่องในหัวมากพอที่จะเขียนอัพเดพไปถึงปีใหม่นี้ได้สบายๆ
เลยล่ะครับ แต่บางทีก็เหนื่อยเหมือนกันครับ อย่างที่คุณ Make Many เขียนไว้แต่ก่อนว่า ความเหนื่อยของคนเขียน Blog (หรือว่าผมจำผิด)
ถูกต้องแล้วครับผมเหอๆ
ๆๆ เยี่ยม
ครับผมกำลังจะเขียนเรื่องที่คุณ iDayBlog อยากจะรู้อยู่ครับตอนนี้แต่ว่ายังไม่เรียบร้อยเดี๋ยวจะออนไลน์ให้อ่านครับ