#JudgementDay & Data Mining

รู้ผลกันไปแล้วสำหรับคดียึดเงินคืนแผ่นดิน ซึ่งก็เป็นไปตามที่เดาไว้ไม่ผิด ที่ยึดทีก็แทบจะใช้หนี้ประเทศที่กู้แหลกไปตอนนี้ได้หลายอยู่ (ถ้ายึดจากนักการเมืองทุกคนที่โกงได้ เราคงปลดหนี้ทั้งประเทศได้เลยนะนี่)
เพื่อให้ไม่เสียความเป็น Geek พอดีช่วงนี้เพิ่งสอบวิชา Data Mining ไปหมาดๆ ว่าแล้วลองเอาวิชาที่ร่ำเรียนมาลองมาใช้กับข้อมูลจริงในวันประวัติศาสตร์นี้กันดีกว่า จะว่าไปมันก็ไม่ได้ทำ mining อะไรหรอก แค่เอา tool ที่ชาวบ้านมีมาลองใช้ดู
ข้อมูล : Twitter – เพราะมี Tools ที่ดึงข้อมูลออกมาได้มากที่สุด
ทำไมต้อง #Judgementday ?
ถ้าใครอ่าน Tweet ในช่วงที่ศาลเริ่มอ่านผลการพิพากษาแล้ว จะเห็น tag นึงที่เป็นที่นิยมใช้กันมากที่สุดคือ #judgementday ซึ่งก่อนหน้าวันนี้ก็ไม่ได้มีนายกออกมาบอกว่า “ชาว Twitter ครับ ผมขอให้ใช้ tag #judgementday แทนวันนี้นะครับ”
แล้วมันมาได้ยังไง ? แสดงว่าต้องมีคนเริ่มก่อน ลองไปดูตามแท็กในรอบอาทิตย์ที่ผ่านมา ก็น่าสนใจมากว่าไม่มีใครใช้แท็กนี้เลย แสดงว่าเป็นแท็กที่มีคนคิดขึ้นมาใหม่ แล้วก็เริ่มมีคนทำตามมา (พลังแห่ง social trend)

ตามไปดูก็พบว่าคนแรกที่ใช้แท็กนี้คือ @bmw2681 และก็ @witwit ตามมา แต่สองคนนี้ไม่ได้ follow ซึ่งกันและกัน เลยคาดว่าจะเหมือนกันโดยบังเอิญ (???) แต่จุดเปลี่ยนก็เกิดขึ้นเมื่อ @jakrapong ได้ tweet ไปให้ @suthichai ว่าน่าจะใช้แท็ก #judgementday เมื่อมีการพูดถึงวันนี้ ซึ่ง @suthichai ก็เห็นว่าเหมาะสมดี จึง retweet ข้อความดังกล่าว และเชิญชวนให้ทุกคนมาใช้แท็กนี้ หลังจากนั้นกราฟของจำนวนการใช้เท็ค

Tip : การพูดถึงเหตุการณ์อะไรเป็นพิเศษควรจะสร้างแท็กใหม่ที่ไม่มีใครใช้มาก่อน เพื่อไม่ให้เกิดความสับสน
หลังจากนั้นกราฟของแท็ก #judgementday ก็พุ่งกระฉูด จึงสรุปได้ว่าทุกคนยอมรับและใช้แท็กนี้เป็นมาตรฐาน ตามกราฟ จึงถือว่าเป็นข้อมูลสำคัญในการแปลผล (target class)

จากกราฟจะเห็นว่าช่วงบ่ายเป็นช่วงที่กราฟขึ้นสูงมาก เพราะศาลเริ่มอ่านคำพิพากษาแล้ว และก็ค่อยๆ ลดลง ตามความยาวยืดที่ไม่รู้ว่าจะจบเมื่อไหร่ จุดเปลี่ยนสำคัญคือช่วงเวลา 2 ทุ่มที่หลายคนเลิกงาน เลิกเรียน และติดตามผลกันอย่างเต็มที่ ไปจนถึงจุดสุดยอด !! ที่เวลา 20.22 เป็นจุดที่จำนวนเงินที่ถูกยึดออกมาพอดี

มีอยู่กราฟนึงที่น่าสนใจ คือเป็นการเทียบว่าแท็ก #judgementday นั้นจะมีการ tweet ไปพร้อมๆ กับคำใดบ้าง ซึ่งจากรูปก็ต้องบอกได้เลยว่า งานนี้ @suthichai ชนะเลิศ มีคนนำไป retweet กันมากที่สุด .. เพราะงั้นหลังจากนี้เราควรศึกษาข้อมูล #judgementday เทียบกับ @suthichai เพราะถือว่าเป็นข้อมูลที่มีความเกี่ยวข้องกันมากที่สุด (basket analysis ใน associate dm)

งั้นลองมาดูกราฟเดิมแต่เป็นข้อมูลเฉพาะ @suthichai จะเห็นความน่าตกใจอย่างนึงคือเฉพาะวันนี้ #judgementday แทบจะถูกใช้คู่กับ @suthichai มาโดยตลอดทั้งวัน เป็นการยืนยัน coupling ที่ดีของข้อมูล
สิ่งนึงที่น่าสงสัยคือ .. แล้ว @thaksinlive หายไปไหน ?
จริงอยู่ว่าถึงแม้วันนี้ @thaksinlive จะของดฟังผลอยู่ที่ดูไบ และไม่ tweet อะไรเลย แต่จากกราฟข้างบนจะเห็นว่าคนพูดถึงน้อยมาก ซึ่งก็เป็นไปได้ว่าชาวไทยยังไม่นิยมที่จะพูดถึง @thaksinlive แทนคำว่า ทักษิน มากนัก
งั้นเราลองมาดูความเกี่ยวข้องกันของ #judgementday , @suthichai , @thaksinlive

จากกราฟนี้จะเห็นได้ว่า #judgementday กับ @suthichai มีความเกี่ยวข้องกันอย่างหนาแน่นมาก แต่ #judgementday กับ @thaksinlive ก็มีความสัมพันธ์กันเช่นกัน ถึงจะน้อยกว่ากรณีแรก 5 เท่าก็ตาม แต่ก็เป็นไปตามที่คาดไว้ข้างต้น
ส่วนที่ดีมากของกราฟนี้อีกอย่างคือดูความไม่เกี่ยวข้องกันเลย จะเห็นว่า @thaksinlive ไม่ได้เกี่ยวอะไรกับ @suthichai มากนัก และยิ่งถ้าเอาทั้ง 3 มารวมกัน ยิ่งไม่เกี่ยวกันเข้าไปใหญ่ ..​ แสดงว่า #judgementday เป็นตัวกลางสร้างความสัมพันธ์ระหว่าง @suthichai กับ @thaksinlive แบบอ้อมๆ

ดูรูปมาเยอะ มาดูที่ตัวอักษรจริงๆ เลยดีกว่า ในกราฟ Spectrum นี้ จะเห็นว่า keyword ที่สำคัญกับทั้งสองตัวแปลนี้ก็คือเรื่องที่เกิดในวันนี้นั่นเอง ไม่ว่าจะเป็น thaksin , billion , verdict หรือแม้แต่ @nationchannel24
สุดท้าย .. เหตุการณ์นี้จะมีผลต่อจำนวนคนที่มาสมัคร follow ใครคนใดเพิ่มขึ้นเป็นพิเศษหรือไม่ ?

ถ้า twitter ใช้เป็นเครื่องมืโฆษณาได้ เราก็จะเห็นการ retweet ของ @suthichai ที่พยายามนำเสนอ @nationtv , @nationchannel24 , @oknationblog เข้ามาด้วย .. ซึ่งก็ได้อานิสงค์จริงคือมีคนเอาชื่อนี้ไป retweet เยอะมาก แต่จะมีผลกับการตัดสินใจ follow ตามหรือไม่ ?
ผลก็คือ ไม่ค่อยมีผลนัก .. จากกราฟจะเห็นว่าจำนวนคน follow ทั้ง 3 account นี้เพิ่มขึ้นตามปกติ ไม่มีนัยยะสำคัญพอที่จะบอกว่าเหตุการณ์นี้มีผลกับการเลือก follow ตาม

กับ @thaksinlive และ @suthichai เองก็เช่นกัน
:: สรุป ::
#judgementday ได้เป็นแท็กสากล จากการแนะนำของ @suthichai ซึ่งมีคน follow มากพอ จึงสามารถกำหนดมาตรฐานได้ และทั้ง 2 keyword ก้มีผลซึ่งกันและกันไปตลอดทั้งวันนี้ โดยมี @thaksinlive เป็นตัวแปลตาม
ส่วนการที่มีคน retweet มาก หรือผ่านตาคนมากไม่ได้มีผลอะไรมากนักกับการเลือก follow หรือไม่ follow ตามกัน

ขอเกรดด้วยนะครับอาจารย์ 😀

ปล. ส่งท้ายด้วยรูปหน้าเว็บหลักๆ ที่ขึ้นหน้าหนึ่งข่าวนี้ .. ของเค้าดังจริงๆ นะ