Saturday, February 27, 2010

#JudgementDay & Data Mining



รู้ผลกันไปแล้วสำหรับคดียึดเงินคืนแผ่นดิน ซึ่งก็เป็นไปตามที่เดาไว้ไม่ผิด ที่ยึดทีก็แทบจะใช้หนี้ประเทศที่กู้แหลกไปตอนนี้ได้หลายอยู่ (ถ้ายึดจากนักการเมืองทุกคนที่โกงได้ เราคงปลดหนี้ทั้งประเทศได้เลยนะนี่)

เพื่อให้ไม่เสียความเป็น Geek พอดีช่วงนี้เพิ่งสอบวิชา Data Mining ไปหมาดๆ ว่าแล้วลองเอาวิชาที่ร่ำเรียนมาลองมาใช้กับข้อมูลจริงในวันประวัติศาสตร์นี้กันดีกว่า จะว่าไปมันก็ไม่ได้ทำ mining อะไรหรอก แค่เอา tool ที่ชาวบ้านมีมาลองใช้ดู

ข้อมูล : Twitter - เพราะมี Tools ที่ดึงข้อมูลออกมาได้มากที่สุด

ทำไมต้อง #Judgementday ?

ถ้าใครอ่าน Tweet ในช่วงที่ศาลเริ่มอ่านผลการพิพากษาแล้ว จะเห็น tag นึงที่เป็นที่นิยมใช้กันมากที่สุดคือ #judgementday ซึ่งก่อนหน้าวันนี้ก็ไม่ได้มีนายกออกมาบอกว่า "ชาว Twitter ครับ ผมขอให้ใช้ tag #judgementday แทนวันนี้นะครับ"

แล้วมันมาได้ยังไง ? แสดงว่าต้องมีคนเริ่มก่อน ลองไปดูตามแท็กในรอบอาทิตย์ที่ผ่านมา ก็น่าสนใจมากว่าไม่มีใครใช้แท็กนี้เลย แสดงว่าเป็นแท็กที่มีคนคิดขึ้นมาใหม่ แล้วก็เริ่มมีคนทำตามมา (พลังแห่ง social trend)



ตามไปดูก็พบว่าคนแรกที่ใช้แท็กนี้คือ @bmw2681 และก็ @witwit ตามมา แต่สองคนนี้ไม่ได้ follow ซึ่งกันและกัน เลยคาดว่าจะเหมือนกันโดยบังเอิญ (???) แต่จุดเปลี่ยนก็เกิดขึ้นเมื่อ @jakrapong ได้ tweet ไปให้ @suthichai ว่าน่าจะใช้แท็ก #judgementday เมื่อมีการพูดถึงวันนี้ ซึ่ง @suthichai ก็เห็นว่าเหมาะสมดี จึง retweet ข้อความดังกล่าว และเชิญชวนให้ทุกคนมาใช้แท็กนี้ หลังจากนั้นกราฟของจำนวนการใช้เท็ค



Tip : การพูดถึงเหตุการณ์อะไรเป็นพิเศษควรจะสร้างแท็กใหม่ที่ไม่มีใครใช้มาก่อน เพื่อไม่ให้เกิดความสับสน

หลังจากนั้นกราฟของแท็ก #judgementday ก็พุ่งกระฉูด จึงสรุปได้ว่าทุกคนยอมรับและใช้แท็กนี้เป็นมาตรฐาน ตามกราฟ จึงถือว่าเป็นข้อมูลสำคัญในการแปลผล (target class)



จากกราฟจะเห็นว่าช่วงบ่ายเป็นช่วงที่กราฟขึ้นสูงมาก เพราะศาลเริ่มอ่านคำพิพากษาแล้ว และก็ค่อยๆ ลดลง ตามความยาวยืดที่ไม่รู้ว่าจะจบเมื่อไหร่ จุดเปลี่ยนสำคัญคือช่วงเวลา 2 ทุ่มที่หลายคนเลิกงาน เลิกเรียน และติดตามผลกันอย่างเต็มที่ ไปจนถึงจุดสุดยอด !! ที่เวลา 20.22 เป็นจุดที่จำนวนเงินที่ถูกยึดออกมาพอดี



มีอยู่กราฟนึงที่น่าสนใจ คือเป็นการเทียบว่าแท็ก #judgementday นั้นจะมีการ tweet ไปพร้อมๆ กับคำใดบ้าง ซึ่งจากรูปก็ต้องบอกได้เลยว่า งานนี้ @suthichai ชนะเลิศ มีคนนำไป retweet กันมากที่สุด .. เพราะงั้นหลังจากนี้เราควรศึกษาข้อมูล #judgementday เทียบกับ @suthichai เพราะถือว่าเป็นข้อมูลที่มีความเกี่ยวข้องกันมากที่สุด (basket analysis ใน associate dm)



งั้นลองมาดูกราฟเดิมแต่เป็นข้อมูลเฉพาะ @suthichai จะเห็นความน่าตกใจอย่างนึงคือเฉพาะวันนี้ #judgementday แทบจะถูกใช้คู่กับ @suthichai มาโดยตลอดทั้งวัน เป็นการยืนยัน coupling ที่ดีของข้อมูล

สิ่งนึงที่น่าสงสัยคือ .. แล้ว @thaksinlive หายไปไหน ?
จริงอยู่ว่าถึงแม้วันนี้ @thaksinlive จะของดฟังผลอยู่ที่ดูไบ และไม่ tweet อะไรเลย แต่จากกราฟข้างบนจะเห็นว่าคนพูดถึงน้อยมาก ซึ่งก็เป็นไปได้ว่าชาวไทยยังไม่นิยมที่จะพูดถึง @thaksinlive แทนคำว่า ทักษิน มากนัก

งั้นเราลองมาดูความเกี่ยวข้องกันของ #judgementday , @suthichai , @thaksinlive



จากกราฟนี้จะเห็นได้ว่า #judgementday กับ @suthichai มีความเกี่ยวข้องกันอย่างหนาแน่นมาก แต่ #judgementday กับ @thaksinlive ก็มีความสัมพันธ์กันเช่นกัน ถึงจะน้อยกว่ากรณีแรก 5 เท่าก็ตาม แต่ก็เป็นไปตามที่คาดไว้ข้างต้น

ส่วนที่ดีมากของกราฟนี้อีกอย่างคือดูความไม่เกี่ยวข้องกันเลย จะเห็นว่า @thaksinlive ไม่ได้เกี่ยวอะไรกับ @suthichai มากนัก และยิ่งถ้าเอาทั้ง 3 มารวมกัน ยิ่งไม่เกี่ยวกันเข้าไปใหญ่ ..​ แสดงว่า #judgementday เป็นตัวกลางสร้างความสัมพันธ์ระหว่าง @suthichai กับ @thaksinlive แบบอ้อมๆ



ดูรูปมาเยอะ มาดูที่ตัวอักษรจริงๆ เลยดีกว่า ในกราฟ Spectrum นี้ จะเห็นว่า keyword ที่สำคัญกับทั้งสองตัวแปลนี้ก็คือเรื่องที่เกิดในวันนี้นั่นเอง ไม่ว่าจะเป็น thaksin , billion , verdict หรือแม้แต่ @nationchannel24

สุดท้าย .. เหตุการณ์นี้จะมีผลต่อจำนวนคนที่มาสมัคร follow ใครคนใดเพิ่มขึ้นเป็นพิเศษหรือไม่ ?



ถ้า twitter ใช้เป็นเครื่องมืโฆษณาได้ เราก็จะเห็นการ retweet ของ @suthichai ที่พยายามนำเสนอ @nationtv , @nationchannel24 , @oknationblog เข้ามาด้วย .. ซึ่งก็ได้อานิสงค์จริงคือมีคนเอาชื่อนี้ไป retweet เยอะมาก แต่จะมีผลกับการตัดสินใจ follow ตามหรือไม่ ?

ผลก็คือ ไม่ค่อยมีผลนัก .. จากกราฟจะเห็นว่าจำนวนคน follow ทั้ง 3 account นี้เพิ่มขึ้นตามปกติ ไม่มีนัยยะสำคัญพอที่จะบอกว่าเหตุการณ์นี้มีผลกับการเลือก follow ตาม



กับ @thaksinlive และ @suthichai เองก็เช่นกัน


:: สรุป ::

#judgementday ได้เป็นแท็กสากล จากการแนะนำของ @suthichai ซึ่งมีคน follow มากพอ จึงสามารถกำหนดมาตรฐานได้ และทั้ง 2 keyword ก้มีผลซึ่งกันและกันไปตลอดทั้งวันนี้ โดยมี @thaksinlive เป็นตัวแปลตาม

ส่วนการที่มีคน retweet มาก หรือผ่านตาคนมากไม่ได้มีผลอะไรมากนักกับการเลือก follow หรือไม่ follow ตามกัน

ขอเกรดด้วยนะครับอาจารย์ :D

ปล. ส่งท้ายด้วยรูปหน้าเว็บหลักๆ ที่ขึ้นหน้าหนึ่งข่าวนี้ .. ของเค้าดังจริงๆ นะ














0 comments: