เมื่อ Google ประมวลผลแนวโน้มการระบาดไข้หวัดใหญ่ 2009
Oct 08
คนทั่วโลกส่วนใหญ่จะรู้จัก กูเกิล หรือ Google (หรือที่บางคนชอบเรียกว่า พี่ “กู”) ในฐานะผู้ให้บริการค้นหาข้อมูลบน Internet อันดับหนึ่งของโลก นอกจากการค้นหาแล้ว หลายคนยังใช้บริการของ Google หลายตัวในชีวิตประจำวันด้วย เช่น Google Mail หรือ Gmail, Google Maps, Google Earth และอื่นๆ อีกมากมาย จนหลายคนคิดไปไกลว่า Google กำลังจะครองโลก
ดูเหมือนว่า “เทคโนโลยี” และ “นวัตกรรม” จะเป็นจุดเด่นที่สุดของกูเกิล ล่าสุดกูเกิลก็เกาะกระแสความดังของ ไข้หวัดใหญ่ 2009 โดยการทดลองประมวลผลแนวโน้มการระบาดของโรคนี้ โดยเริ่มต้นจากภูมิภาคสำคัญๆ ของโลกก่อน เช่น อเมริกา นิวซีแลนด์ ออสเตรเลีย กูเกิลมิได้เกาะกระแสความดังแบบเล่นๆ ครับ แต่ยังแสดงให้เห็นถึงความเชี่ยวชาญในการประมวลผลทางสถิติ โดยนำข้อมูลจากบริการค้นหาของตนเองมาใช้ให้เป็นประโยชน์ได้อย่างน่าทึ่ง
ในขณะที่พวกเราค้นหาข้อมูลใน Internet โดยใช้บริการของกูเกิลนั้น กูเกิลได้เก็บข้อมูลการค้นหาของเราไว้อย่างละเอียด เช่น คำที่ค้นหา (Keywords) วัน เวลา ไอพี (IP Address) และอื่นๆ อีกมากมาย
กูเกิลมีแนวคิดว่า
“คำที่ใช้ค้นหาบางคำนั้น เป็นสิ่งบ่งชี้ถึงภาวะการณ์ของไข้หวัดใหญ่ได้เป็นอย่างดี”
“We’ve found that certain search terms are good indicators of flu activity”
ตัวอย่างแนวคิดของกูเกิลก็คือ ทุกสัปดาห์จะมีผู้ใช้งานอินเตอร์เน็ททั่วโลกทำการค้นหาข้อมูลเกี่ยวกับสุขภาพอยู่เนืองๆ และก็คงจะคาดกันอย่างคร่าวๆ ได้ว่า
- จะมีการค้นหาข้อมูลเกี่ยวกับไข้หวัดใหญ่เพิ่มขึ้นจากปกติ ในระหว่างฤดูกาลระบาดของไข้หวัดใหญ่
- จะมีการค้นหาเกี่ยวกับโรคภูมิแพ้เพิ่มขึ้น ในระหว่างฤดูกาลของโรคภูมิแพ้ (โดยมากจะเป็นฤดูใบไม้ผลิ หรือถ้าเป็นเมืองไทยก็จะเป็นฤดูหนาว ซึ่งเป็นช่วงที่พืชไม้ดอกส่วนใหญ่กำลังออกดอก)
- จะมีการค้นหาเรื่องของผิวไหม้จากแสงแดด ในระหว่างช่วงฤดูร้อน
แต่ว่าสถิติการค้นหาดังกล่าว จะสามารถใช้เป็นข้อมูลในการประเมินที่น่าเชื่อถือได้หรือไม่ นี่เป็นสิ่งที่จะต้องพิสูจน์ และกลั่นกรองกันต่อไป
ด้วยเหตุนี้ กูเกิลจึงรวบรวบข้อมูลการค้นหาตามแนวคิดดังกล่าว เพื่อลองประเมินภาวะการณ์ของไข้หวัดใหญ่ 2009 ทั่วโลก ว่าจะสามารถนำมาใช้ประโยชน์ตามที่หวังไว้ได้หรือไม่
Influenza-Like Illness percentage (ILI %)
หน่วยงานสาธารณสุขของหลายๆ ประเทศเช่น สหรัฐอเมริกา, ออสเตรเลีย และประเทศอื่นๆ ใช้รายงานอัตราส่วนเป็นเปอร์เซ็นของ “จำนวนผู้ป่วยที่มีอาการคล้ายกับไข้หวัดใหญ่” ต่อ “จำนวนผู้ป่วยที่มาพบแพทย์” ในการประเมินภาวะการณ์ของการระบาดไข้หวัดใหญ่ จำนวนเปอร์เซ็นของ ILI ที่มาก แสดงว่ามีจำนวนผู้ป่วยที่แสดงอาการของไข้หวัดใหญ่มาก
ซึ่งอาการเหล่านี้อาจจะเกิดจากไวรัสไข้หวัดใหญ่ตามฤดูกาล (Seasonal Enfluenza Virus) หรือไวรัสอื่นที่สามารถทำให้ผู้ป่วยมีอาการคล้ายไข้หวัดใหญ่ก็เป็นได้ การเพิ่มขึ้นของตัวเลข ILI ดังกล่าว เป็นการส่งสัญญาณให้สาธารณสุขเข้ามาหาสาเหตุ หรือตัวการที่ทำให้เกิดปรากฎการณ์ดังกล่าวได้ทันเวลา
การประมวลผลแบบทันที (Real-Time)
ศูนย์การควบคุมโรคของสหรัฐอเมริกา (U.S. Centers for Disease Control : U.S. CDC) ใช้การรวบรวมข้อมูล ILI ที่ได้จากเครือข่ายเฝ้าระวังด้านสุขภาพ มาประมวลผลเพื่อเฝ้าดูสัญญาณผิดปกติดังที่ได้กล่าวมาแล้ว การประมวลผลดังกล่าวอาจต้องใช้เวลารวบรวมและประมวลผลถึง 2 สัปดาห์ กว่าจะประกาศให้สาธารณะทราบได้ แต่ระบบที่กูเกิลกำลังวิจัยอยู่นั้นให้ผลเกือบจะทันทีทันใด ดังเห็นได้จากรูป

รูปที่ 1
ในรูปที่ 1 กราฟเส้นสีเหลืองเป็นข้อมูลจาก U.S. CDC ส่วนเส้นสีฟ้านั้นเป็นข้อมูลจากกูเกิล แสดงว่า
- ข้อมูลจากกูเกิล แสดงให้เห็นภาวะการณ์ของไข้หวัดใหญ่ว่า กำลังมีแนวโน้มเพิ่มสูงขึ้นในวันที่ 2008-01-28
- ข้อมูลจาก U.S. CDC แสดงข้อมูลที่ช้ากว่าประมาณ 2 สัปดาห์ และยังไม่เห็นแนวโน้มการเพิ่มขึ้นของผู้มีอาการไข้หวัดใหญ่ (ILI)

รูปที่ 2
ในรูปที่ 2 ต่อมาจะพบว่า
- ข้อมูลจากกูเกิล ยังคงแสดงภาวะการณ์ของไข้หวัดใหญ่ ว่ากำลังมีแนวโน้มเพิ่มสูงขึ้นในวันที่ 2008-02-04
- ข้อมูลจาก U.S. CDC ยังคงแสดงข้อมูลที่ช้ากว่าประมาณ 2 สัปดาห์ และเพิ่งจะเริ่มมีข้อมูลที่แสดงให้เห็นว่า มีการเพิ่มขึ้นของผู้มีอาการไข้หวัดใหญ่

รูปที่ 3
ในรูปที่ 3 จะพบว่า เส้นกราฟประเมินภาวะการณ์ของกูเกิลนั้น ยังคงนำหน้าและใกล้เคียงกับที่ U.S. CDC ประกาศออกมา (หลังจากเวลาผ่านมาแล้วเกือบ 2 สัปดาห์)

รูปที่ 4
ในรูปที่ 4 เป็นกราฟเปรียบเทียบระหว่างการประเมินภาวะการณ์จากข้อมูลของกูเกิล และข้อมูล ILI จาก U.S. CDC ซึ่งจะเห็นว่าในเวลาหลายปีที่ผ่านมา กราฟทั้งสองมีลักษณะใกล้เคียงกันมาก

รูปที่ 5
ในรูปที่ 5 เป็นกราฟเปรียบเทียบระหว่างการประเมินภาวะการณ์จากข้อมูลของกูเกิล และข้อมูล ILI จากออสเตรเลีย (VIDRL: Victorian Infectious Diseases Reference Laboratory) ซึ่งจะเห็นว่ากราฟทั้งสองมีลักษณะใกล้เคียงกันมากเช่นกัน

รูปที่ 6
ในรูปที่ 6 เป็นกราฟเปรียบเทียบระหว่างการประเมินภาวะการณ์จากข้อมูลของกูเกิล และข้อมูล ILI จากสถาบันวิจัยวิทยาศาสตร์และสิ่งแวดล้อม ซึ่งให้ทุนสนับสนุนโดยกระทรวงสาธารณสุขนิวซีแลนด์ (WHO National Influenza Centre at the Institute of Environmental Science and Research) ซึ่งจะเห็นว่ากราฟทั้งสองมีลักษณะใกล้เคียงกันมากเช่นกัน
คราวนี้เราลองมาลองแนวคิดนี้กันเองดีกว่าครับ กูเกิลเองนั้นมีบริการค้นหาแบบพิเศษ ซึ่งสามารถตรวจสอบปริมาณการค้นหาจากทั่วโลกได้คือ Google Insights for Search บริการนี้จะทำให้เราสามารถตรวจสอบได้ว่า คำที่เราต้องการ (เช่น “ไข้หวัดใหญ่ 2009“, “flu 2009“) นั้นมีปริมาณการค้นหาอย่างไร ผลการค้นหานี้มิได้แสดงเป็นจำนวนครั้ง แต่แสดงเป็นจำนวนเปอร์เซ็น (%) ของปริมาณสูงสุดในช่วงเวลาที่เราต้องการ ดังนั้นตัวเลขที่เราเห็นจะมีค่าสูงสุดเป็น 100 (%) เสมอ

รูปที่ 7
ที่เว็บค้นหานี้ (รูปที่ 7) เราจะลองค้นหาคำ “flu 2009” โดยเราจะค้นหาสถิติในปี 2009 จากเว็บทั่วโลกกันดูนะครับ ผลปรากฎดังข้างล่าง (รูปที่ ![]()

รูปที่ 8
จากกราฟแสดงผลการค้นหาสถิติ “flu 2009” ในปี 2009 จากทั่วโลก ( ตามรูปที่ 8 ) จะพบว่า:
- เมื่อคุณเอาเมาส์ชี้ไปบนกราฟ กราฟจะแสดงปริมาณเป็น ร้อยละของปริมาณสูงสุด และเวลาบนกราฟที่เมาส์ชี้อยู่ (บนขวาของตัวกราฟ)
- มีปริมาณการค้นหาสูงสุดในช่วงปลายเดือน เมษายน 2009 คือ 100 (สเกลเต็มของปริมาณสูงสุด)
- ในช่วงเดือนเมษายน 2009 จะเป็นช่วงที่ไข้หวัดใหญ่ 2009 กำลังเริ่มเป็นข่าวดังไปทั่วโลก และเริ่มแพร่ระบาดไปในหลายประเทศ
- ปริมาณการค้นหา “flu 2009″ ตลอดปี 2009 โดยเฉลี่ยคือ 13% ของปริมาณการค้นหาสูงสุด (เดือนเมษายน 2009) ดังแสดงไว้ที่มุมบนขวาขวาของภาพ

รูปที่ 9
ผลการค้น “flu 2009” ต่อมา (รูปที่ 9) ยังแสดงแผนภูมิปริมาณค้นหาตามภูมิภาคต่างๆ ทั่วโลกโดยจะพบว่า:
- ในช่วงปี 2009 ประเทศสหรัฐอเมริกามีปริมาณการค้นหาสูงสุด (เต็ม 100)
- อันดับรองลงมาคือ สิงคโปร์ ออสเตรเลีย อินโดนีเซีย อินเดีย …
- ส่วนไทย (เอาเมาส์ไปชี้ที่แผนที่) มีปริมาณการค้นหาประมาณ 47% ของปริมาณการค้นหาสูงสุด
และที่ด้านล่างของกราฟนั้น คุณจะพบลิงค์ “ดูการเปลี่ยนแปลงตลอดระยะเวลา” ซึ่งเมื่อคลิกที่ลิงค์ กราฟแผนที่ที่แสดงอยู่ จะเริ่มแสดงการเปลี่ยนแปลงปริมาณการค้นหา ในแต่ละช่วงเวลาไปเรื่อยๆ คล้ายกับเป็น ผังวิดีโอแสดงการระบาดหรือการตื่นตัวของ “flu 2009″ ไปโดยอัตโนมัติ
แล้วประเทศไทยหล่ะเป็นอย่างไร เราลองดูสถิติการค้นหาคำว่า “ไข้หวัดใหญ่ 2009” ในปี 2009 กันดูครับ ผลที่ได้เป็นดังรูปที่ 10

รูปที่ 10
จากกราฟในรูปที่ 10 เราจะพบว่า
- ในช่วงปี 2009 ประเทศไทยมีปริมาณการค้นหาสูงสุด (100) ในช่วง 12-18 กรกฎาคม 2009 (2009-08) ซึ่งในช่วงนี้เป็นช่วงที่อัตราการเสียชีวิตด้วยไข้หวัดใหญ่ 2009 กำลังมีอยู่อย่างต่อเนื่อง (เสียชีวิต 111 ราย)
- อัตราการค้นหา “ไข้หวัดใหญ่ 2009″ โดยเฉลี่ยทั้งปีคือ 17% ของปริมาณการค้นหาสูงสุด (ในช่วง 12-18 กรกฎาคม 2009)
ที่ด้านล่างของผลการค้นหา จะแสดงคำค้นหาอื่นๆ ที่เกี่ยวข้อง เช่น “Swin Flu 2009“, “Swin Flu“, “h1n1” ซึ่งเมื่อคลิกไป ก็จะเป็นการแสดงสถิติการค้นหาของคำดังกล่าว โดยผลจะใกล้เคียงกัน คือมีปริมาณค้นหาสูงสุดในเดือนเมษายน – กรกฎาคม 2009 ซึ่งบางช่วงอาจยังไม่มีการตั้งชื่อของโรคนี้อย่างเป็นทางการ
จากข้อมูลทั้งหมดที่กล่าวมา เราจะพบว่ากูเกิล (และประเทศในแถบยุโรป หรือพวก “ฝรั่ง”) นั้นนำข้อมูลทางสถิติมาใช้ได้อย่างน่าทึ่งและมีประสิทธิภาพเป็นอย่างมาก
หันกลับมาดูที่ประเทศไทยเราบ้าง ผมพยายามค้นหาข้อมูลทางสถิติของโรคต่างๆ จากหน่วยงานราชการ แต่ก็อย่างที่ทุกท่านคงเดากันได้คือ “ไม่พบ” ครับ มันเป็นเรื่องตลกที่หัวเราะไม่ออก และออกไปในทางน่าเศร้าเสียด้วยซ้ำ ชีวิตคนไทย (ส่วนใหญ่) อยู่ในกำมือของคนส่วนน้อย ที่ไม่เคยคิดจะสนใจคนส่วนใหญ่ของประเทศนี้เลย เฮ้อ…

คลิกที่นี่ เพื่อสมัครรับข่าวจากเรา