搜尋引擎的七種使用者
凡走過必留下痕跡…
先前 AOL 說為了要給大家做研究,就公佈了 65 萬個使用者的 3600 萬筆搜尋資料,當然這些資料有經過一些處理,例如說使用者名稱被亂數編號取代 (但是同一個使用者用的是同一個編號);很顯然的這件事相當地不妥,他們也馬上出來道歉。
不過你也知道,網路上多的是無聊人,而且這次的資料相當寶貴,是 "真實的人類活動",對於了解網路使用者的行為而言具有相當的重要性,所以這份 log 一公佈,馬上就被大家 "妥善" 地保存了起來,除了有集中式的 FTP / HTTP 下載點外,也有 BT / eMule 的下載方法,看情況是會永久流傳了 XD 當然啦,無聊的學術人員不會只是把 log 拿出來看看就算了,一定會有人去進行分析;果然一星期後的今天,第一份分析結果終於出爐啦 :)
其實在之前已經有人找出過其中的某些編號是什麼人了 (例如說 New York Times 就找到了 No. 4417749),或是從搜尋字詞中看出一個人心態的轉變 (例如說 No. 672368 從 "我懷孕了但是他不想要孩子" 到 "懷孕期間吃什麼比較好" 到 "Charlotte NC (北卡的某處) 的墮胎診所" 到 "基督徒墮胎可以被寬恕嗎");不過這次的分析是不一樣的,這次是把所有這 65 萬個使用者依其使用搜尋引擎的行為分成七大類,某種程度上來說,你、或我,應該也可以被歸到這七大類中。
第一類叫做 "Pornhound",沒錯,就是搜尋情色相關資訊。然後他們還發現,這個族群還可以再粗分成兩個子群,有一群是不管什麼時候都會搜尋情色相關資訊,有一群是只有在某些特定時間才會搜尋情色相關;文中舉了一個 No. 190827 的例子,他在午夜前的搜尋都是些像是 "笑話" 或是 "詩" 之類的正常東西,但是十二點一過就變成 "黃色笑話"、"和狗做愛的女孩" 這種 XD
第二類叫 "Manhunter",就是用搜尋引擎來尋人的。根據分析,似乎沒有出現 "長期追蹤某一個人" 的現象,大部份的搜尋都好像曇花一現,集中出現在某一段時間,然後就沒下文了,他們的解讀是這些使用者可能是在做人事背景調查,或者是在找失散多年的朋友。
第三類叫 "Shopper",購物前會先調查評價的就是這種人。例如說他們發現 No. 3659741 在短短三天之內找了 37 次 "treo 700";大部份的人找的東西都還蠻實際的,例如說找找 "coupons" 之類的東西。
第四類叫 "Obsessive",會一直重複搜尋某項資訊。根據分析,他們的搜尋頻率有點像是 "A, A, A, A, B, A, A, C, A, D, A" 這樣,一直無法忘情,偶爾想到就會搜尋一下;而且,這類使用者會使用比較精確的搜尋功能,可以有效地減少亂槍打鳥的情況。
第五類叫 "Omnivore",雜食性動物。他們什麼都查,沒有什麼特定的分類趨向。
第六類叫 "Newbie",電腦新手。怎樣判斷新手呢 ? 例如,No. 12792510 把 search box 和 URL line 搞混了,一直在搜尋 "www.google";還有些人在搜尋的字詞間沒有加空格隔開。
第七類叫 "Basket Case",無助的人 XD 這些人用電腦來抒發情緒,他們的搜尋用詞都是一些像是 "我討厭我的工作" 或是 "為什麼我長得不好看" 之類的字句;另外他還舉了 No. 3696023 當例子,這位仁兄寫了好長的一句 "i hurt when i think too much i love roadtrips i hate my weight i fear being alone for the rest of my life."
Comments
Comment from brian
Time 2006/08/16 at 10:44 上午
真希望哪天,台灣或中文GOOGLE也來膽敢公佈這類資料來讓大家研究看看~~~~~
Pingback from -TMA-1- » links for 2006-08-17
Time 2006/08/17 at 8:25 上午
[...] 國生三年才開始 » 搜尋引擎的七種使用者 (tags: Tech Research Search) [...]
Pingback from Morton’s Weblog » Blog Archive » 人在做,只有天在看?
Time 2006/08/21 at 12:52 上午
[...] ijliao 的《搜尋引擎的七種使用者》把 AOL 公開放出 search engine log 給大家做
Pingback from AOL 開除 CTO 和兩名員工 at wILliAm bLog
Time 2006/08/22 at 4:09 下午
[...] 看樣子之前發出的道歉聲明還是沒辦法平息重怒啊!不過現在不管 AOL 怎麼善後,都無法彌補使用者隱私被曝露後的影響哪! [...]
Trackback from 終極邊疆BLOG
Time 2006/08/29 at 1:21 上午
Google的記錄搜尋…
是我比較後知後覺嗎? 剛剛才發現 google多了一個「記錄搜尋」(人家2005/4 就有英文版的了):
裡頭會列出你過往的搜尋紀錄,還可以「搜尋」你的搜尋紀錄…..
首先聯想到的,是才剛剛發生…
Pingback from 被搜尋最多次的詞 at Gea-Suan Lin’s BLOG
Time 2006/10/09 at 11:28 上午
[...] 在 AOL 惡搞後 (參考 ijliao 寫的 搜尋引擎的七種使用者),有人統計了被搜尋最多的詞:Google is No. 1 search on AOL,這實在是太爆笑了 XD [...]
Pingback from OMGD » haha
Time 2006/08/16 at 7:00 上午
[...] hahaha 這個很好笑 讓我想到某些人 XD 原文更好笑 [...]