Gmail 的 spam 判定
最近改了演算法嗎 ?
spam 判定本來就不是個很容易的問題,這大家都很清楚,目前比較好的做法都是靠電腦自動判定,然後使用者可以訓練電腦判定的模式,讓判定更準確。先前 Gmail 的表現一直很不錯,漏網之魚越來越少 (我把我所有的信都 forward 一份上去,包括一大堆 mailing list),但是應該是從兩三天前開始吧,整個表現突然完全改觀…
一開始是有幾個 freebsd commit log 被當成 spam,我本來想說可能是格式固定、來源相同、而且量又多,所以被誤判;但是後來就越來越糟,我每天都要從 Spam 裡面撈回一半不是 spam 的信件,而沒被判定為 spam 的信件中,超過 90% 是 spam … 啊這樣比我自己用人工判斷還累 orz 最糟的是,spam filter 這個功能還不能關掉 :~~
Comments
Comment from M
Time 2006/05/13 at 10:50 下午
gmail最近的確是這樣, 好幾個blog也都有提出這個問題
Comment from shiyee
Time 2006/05/14 at 12:12 上午
我也有同樣的感覺
連萬惡pchome 垃圾信 也被當成正當郵件
使用者的回報(垃圾TO正常 正常TO垃圾)都失效了
Comment from pofeng
Time 2006/05/14 at 1:42 下午
應該建議 gmail 增加 whitelist 的功能 ?
( 還是已經有了 ? )
Comment from b6s
Time 2006/05/14 at 5:46 下午
我這邊是有些 mailing-list 被當成 spam,不過還不嚴重。這樣看來,最近可能不適合用 gmail 整理 mailing-list……
所以說 spam filter 應該要演化成 spam classifier 啦 orz
Comment from jsj
Time 2006/05/14 at 5:47 下午
我有一些 yam 的新聞被當成 spam, 我想是這樣:
有些人覺得這些新聞是 spam, 於是點了 "回報為廣告信", 當檢舉票數達到一定數量以後, 後來的這些信件就會被自動判斷為 spam.
但是有些人覺得它不應該被當成 spam, 於是點了 "非垃圾郵件", 當回報數到一定數量以後, 這些信件又不會被判斷為 spam.
因為這兩群人對同樣一封信件的感受完全不一樣, 而現在 Google 只能根據回報的結果來調整它 ,
Google 只要再加上 whitelist 和 backlist 的功能讓使用者多一個選擇, 問題就可以解決了, 但是也會增加使用者自己誤設的風險(網路上大多數的初級使用者都有設錯的問題).
Comment from pofeng
Time 2006/05/14 at 7:14 下午
> Google 只要再加上 whitelist 和 backlist 的功能讓使用者
> 多一個選擇, 問題就可以解決了, 但是也會增加使用
> 者自己誤設的風險(網路上大多數的初級使用者都
> 有設錯的問題).
自己誤殺, 總是要自己負責
量大 mailing list 我是用 gmail filter 加 tag
還是會掉信嗎 ?
如果沒有, 應該也可以用 gmail filter 加 個 _NOT_SPAM (的 tag)
應該就不會掉信了
提外話:
像 google 太相信自己的機器
而 yahoo 又太依賴人工 and $
網站登錄 "生活+" 若不繳錢竟然要等一個月 !!!
等下把這 thread 的 url 寄給 gmail team
Comment from ijliao
Time 2006/05/14 at 11:37 下午
不管有沒有 tag,問題是一樣的
gmail 的設計很有趣,就算已經加了 tag,它還是會做 spam 判斷…
Comment from pofeng
Time 2006/05/15 at 12:51 上午
> 不管有沒有 tag,問題是一樣的
> gmail 的設計很有趣,就算已經加了 tag,它還是會做 spam
> 判斷…
這樣很討厭, google 擺明了不相信工人智慧
anyway, 寫了一篇抱怨:
https://services.google.com/inquiry/gmail/zh_TW/gmail_suggest/
主旨: 避免重要信件誤判成 SPAM
1. 能否開放使用者建立 whitelist ( 避免變成 SPAM )
2. gmail filter 加入一個特定的 tag ( eg: _NOT_SPAM )
保證不會被自動掃入 SPAM (tag) folder
3. 量大的 mailing list 我是用 gmail filter 加 tag
如果該 mail 已經有 tag 是否能夠設定保證不當成 spam ?
Comment from ijliao
Time 2006/05/15 at 7:58 上午
但是事實上,tag 並非工人智慧 :)
我的 tag 都是用 filter 設定的… 它也只能做一些單純的條件判斷
再說,用 mailing list 來丟廣告信的人也是不少,以前也都靠 gmail 攔了不少下來,我只是不清楚為什麼最近行為改變這麼多…
Comment from b6s
Time 2006/05/15 at 10:31 上午
搞不好只是 training 過的郵件量大到某個程度之後忽然就……
Comment from shiyee
Time 2006/05/16 at 2:47 下午
1.算法經不起大量郵件考驗…
2.gmail 把以前針對個人行為(回報)計算的權值部份關掉了
導致個人回報失靈
Comment from slzzp
Time 2006/05/18 at 5:05 下午
To b6s: 怎麼聽起來像是某個輸入法的特徵? XD
Comment from pofeng
Time 2007/10/13 at 1:17 上午
終於有 white list 了
http://www.gseeker.com/50226711/google_appsececgmailceaee_120861.php
Comment from Chao,Chie-Min
Time 2006/05/13 at 10:13 下午
我個人覺得是spam的判斷保守了,以前一個星期只有5封以下的spam,這三個星期(不確定多久,大概是這一個月以內的事),信箱有1/3都是spam