2014年8月15日星期五

有關留言

之前在新浪網誌(還有多少人記得??)很多人投訴對垃圾留言把關不力,來到Blogspot又發覺對垃圾留言把關太嚴......

近日久不久發現一些留言被當作垃圾留言對待,而且是打得很長的--奇怪地,似乎留言很長,Blogspot便會當作是垃圾留言。

之前處理時不小心把一些出現了的留言當作是重覆了的留言而刪掉了,幸好大部份都可以找回重貼一次。

網主會盡量不時看看垃圾留言,當中有沒有被誤作垃圾留言的情況。

1 則留言:

  1. blogspot 的後端程序真的是有點奇怪。正常邏輯下, 新加的留言應該是先過 spam filter, 如果沒有問題, 再觸發 Email 通知感興趣的人閱讀。 而 blogspot 不是這樣的。 任何新加留言都會立即觸發 email 通知和送到 comment 的 RSS feed。 然後, 這個新加的留言, 不管是真的還是假的 spam, 可以在你的頁面上存在幾個小時之久。 然後, spam filter 才如夢初醒般對之進行處理,關進小黑屋。 留言者, 發出以後立即 reload 頁面檢查一下, 留言在的, 就離開了。 但是過幾個小時再看, 就沒有了。 奇怪伐? 這不是個別現象, 技術論壇上不少洋人都這樣抱怨。 WordPress 的留言系統就不是這樣運作的,而是: 垃圾留言直接進垃圾箱,不會先出街示眾幾個小時的。 這是個好習慣, 術語叫做 fail fast。這樣,就算有的留言被誤判為 spam, 留言者都可以立時作出反應,自己想辦法調整文句 make the filter happy。

    至於說那個垃圾過濾器的觸媒,我感覺跟留言的長短沒有什麼必然的關係。 應該是文句中特定的字符或者字符組合惹得那個 filter 不開心。 也有很短的留言,幾個小時以後被關小黑屋的。 至於說到底是哪些字符和字符組合, google 才不會公開, 否則那些真正的 spam sender 就魔高一丈咯。

    其實對留言嚴厲審查還只是小事。 以前 Google 最誇張的規則是對 g plus 用戶名的限制。 曾經有一個規矩是, 你的用戶名必須看上去像個真正的名字。 那什麼樣的名字才叫“像真正的名字” 呢? 又是 google 自己秘密定義的, 大家並不知道究竟。 如果有人名叫張三,而 Google 的 spam 規則庫認為, 張三一定是假名, 那麼那位張三同學就很倒霉了, 對牢 Google 出示身份證都沒用的。 這條規則得罪太多人了, 前不久 Google 宣布取消帳號名字的限制。

    新浪時代你的網誌好熱鬧的, 怎麼不記得? 文章質量也很好。 後來大概是因為社交網站的興起, 來這邊講話的人比以前少了些。 不過還是有幾個熟名字不時出現,大家都好忠心的。

    回覆刪除