Gmail 的 spam 判定

13 五月, 2006 (17:58) | 有炮就放

最近改了演算法嗎 ?

spam 判定本來就不是個很容易的問題,這大家都很清楚,目前比較好的做法都是靠電腦自動判定,然後使用者可以訓練電腦判定的模式,讓判定更準確。先前 Gmail 的表現一直很不錯,漏網之魚越來越少 (我把我所有的信都 forward 一份上去,包括一大堆 mailing list),但是應該是從兩三天前開始吧,整個表現突然完全改觀…

一開始是有幾個 freebsd commit log 被當成 spam,我本來想說可能是格式固定、來源相同、而且量又多,所以被誤判;但是後來就越來越糟,我每天都要從 Spam 裡面撈回一半不是 spam 的信件,而沒被判定為 spam 的信件中,超過 90% 是 spam … 啊這樣比我自己用人工判斷還累 orz 最糟的是,spam filter 這個功能還不能關掉 :~~

Technorati Tags: ,

Comments

Comment from Chao,Chie-Min
Date: 2006/5/13, 10:13 下午

我個人覺得是spam的判斷保守了,以前一個星期只有5封以下的spam,這三個星期(不確定多久,大概是這一個月以內的事),信箱有1/3都是spam

Comment from M
Date: 2006/5/13, 10:50 下午

gmail最近的確是這樣, 好幾個blog也都有提出這個問題

Comment from shiyee
Date: 2006/5/14, 12:12 上午

我也有同樣的感覺
連萬惡pchome 垃圾信 也被當成正當郵件

使用者的回報(垃圾TO正常 正常TO垃圾)都失效了

Comment from pofeng
Date: 2006/5/14, 1:42 下午

應該建議 gmail 增加 whitelist 的功能 ?
( 還是已經有了 ? )

Comment from b6s
Date: 2006/5/14, 5:46 下午

我這邊是有些 mailing-list 被當成 spam,不過還不嚴重。這樣看來,最近可能不適合用 gmail 整理 mailing-list……
所以說 spam filter 應該要演化成 spam classifier 啦 orz

Comment from jsj
Date: 2006/5/14, 5:47 下午

我有一些 yam 的新聞被當成 spam, 我想是這樣:

有些人覺得這些新聞是 spam, 於是點了 “回報為廣告信”, 當檢舉票數達到一定數量以後, 後來的這些信件就會被自動判斷為 spam.

但是有些人覺得它不應該被當成 spam, 於是點了 “非垃圾郵件”, 當回報數到一定數量以後, 這些信件又不會被判斷為 spam.

因為這兩群人對同樣一封信件的感受完全不一樣, 而現在 Google 只能根據回報的結果來調整它 ,

Google 只要再加上 whitelist 和 backlist 的功能讓使用者多一個選擇, 問題就可以解決了, 但是也會增加使用者自己誤設的風險(網路上大多數的初級使用者都有設錯的問題).

Comment from pofeng
Date: 2006/5/14, 7:14 下午

> Google 只要再加上 whitelist 和 backlist 的功能讓使用者
> 多一個選擇, 問題就可以解決了, 但是也會增加使用
> 者自己誤設的風險(網路上大多數的初級使用者都
> 有設錯的問題).

自己誤殺, 總是要自己負責

量大 mailing list 我是用 gmail filter 加 tag
還是會掉信嗎 ?

如果沒有, 應該也可以用 gmail filter 加 個 _NOT_SPAM (的 tag)
應該就不會掉信了

提外話:
像 google 太相信自己的機器

而 yahoo 又太依賴人工 and $
網站登錄 “生活+” 若不繳錢竟然要等一個月 !!!

等下把這 thread 的 url 寄給 gmail team

Comment from ijliao
Date: 2006/5/14, 11:37 下午

不管有沒有 tag,問題是一樣的
gmail 的設計很有趣,就算已經加了 tag,它還是會做 spam 判斷…

Comment from pofeng
Date: 2006/5/15, 12:51 上午

> 不管有沒有 tag,問題是一樣的
> gmail 的設計很有趣,就算已經加了 tag,它還是會做 spam
> 判斷…

這樣很討厭, google 擺明了不相信工人智慧

anyway, 寫了一篇抱怨:
https://services.google.com/inquiry/gmail/zh_TW/gmail_suggest/

主旨: 避免重要信件誤判成 SPAM

1. 能否開放使用者建立 whitelist ( 避免變成 SPAM )

2. gmail filter 加入一個特定的 tag ( eg: _NOT_SPAM )
保證不會被自動掃入 SPAM (tag) folder

3. 量大的 mailing list 我是用 gmail filter 加 tag
如果該 mail 已經有 tag 是否能夠設定保證不當成 spam ?

參考資料 http://blog.ijliao.info/archives/2006/05/13/2280/

Comment from ijliao
Date: 2006/5/15, 7:58 上午

但是事實上,tag 並非工人智慧 :)
我的 tag 都是用 filter 設定的… 它也只能做一些單純的條件判斷
再說,用 mailing list 來丟廣告信的人也是不少,以前也都靠 gmail 攔了不少下來,我只是不清楚為什麼最近行為改變這麼多…

Comment from b6s
Date: 2006/5/15, 10:31 上午

搞不好只是 training 過的郵件量大到某個程度之後忽然就……

Comment from shiyee
Date: 2006/5/16, 2:47 下午

1.算法經不起大量郵件考驗…

2.gmail 把以前針對個人行為(回報)計算的權值部份關掉了
導致個人回報失靈

Comment from slzzp
Date: 2006/5/18, 5:05 下午

To b6s: 怎麼聽起來像是某個輸入法的特徵? XD

Comment from pofeng
Date: 2007/10/13, 1:17 上午

終於有 white list 了
http://www.gseeker.com/50226711/google_appsececgmailceaee_120861.php

Write a comment