Google Flu Trends
電腦不只會挑土豆,也會告訴你什麼時候會流行感冒喔~
應該蠻多人知道 Google 有一個叫做 Google Trends 的服務,可以讓使用者比較不同關鍵字的熱門程度。老是讓人拿來比較看說誰會當選也不是辦法 (XD),Google 工程師們手握如此重要資源,決定要做一些有利於國計民生的事,所以他們就找了 CDC 合作,從去年就開始收集 感冒 (flu)
相關的關鍵字,經過了一年的測試確認可信度之後,在這兩天推出了 Google Flu Trends,背後簡單的原理就是 查詢感冒相關關鍵字的人越多,就表示感冒的人越多,不管在時間分佈或空間分佈上都成立
;從這邊可以看得出來五年迴歸測試證明了這玩法真的可行,而且速度還比 CDC 收集的資料要提早 2 星期預警 (?)。
基於這是一個可受公評的公共衛生預測系統,他們也提供了一些資料供大眾下載;當然了,這些資料都是整理統合過後的資訊,沒有隱私外洩的問題 (複習一下之前 AOL 捅出來的漏子吧 : 搜尋引擎的七種使用者)。而在另一篇文章裡也提到,其實這是 Google Trends 團隊未來即將要提供的一系列公共服務的第一炮,以他們掌握如此大量的搜尋紀錄 (每天查詢量可能有幾個 billion,而且合理懷疑他們保留了所有的搜尋紀錄…),套用同一套 data mining 機制應該還可以玩出不少有趣的東西 :)
Technorati Tags: google, flu, search, data mining