貝葉斯郵件過濾
㈠ 我電腦faxmail收到的新郵件怎麼都到垃圾箱了拜託各位了 3Q
打開foxmail-->工具-->反垃圾郵件功能設置-->規則過濾-->級別設置成 低 追問: 還是不可以 是不是在那個規則過濾下有個方框要打對號啊 在把級別拉倒最低啊??? 謝謝哦 回答: 啊 我自己的看了一下 把規則過濾里和貝葉斯過濾的方框都不打對勾就OK啦 追問: 只把過濾強度給調一下就好了是吧。明天給我回復哦 追問: 只把過濾強度給調一下調到最低就好了是吧。明天給我回復哦 回答: 濾強度給調一下調到最低也可以。 它檢測垃圾郵件的原理就是檢索郵件里的一些關鍵字,類似網址連接,廣告之類的就會被定義為垃圾郵件。其實要是個人用的話根本不用過濾,上班無聊的時候看一下這些郵件也挺好玩的。嘿嘿 你只要把反病毒設置一下就可以了
㈡ 最好的反垃圾郵件是誰
反垃圾郵件技術解析
1、概述
電子郵件是最常用的網路應用之一,已經成為網路交流溝通的重要途徑。但是,垃圾郵件(spam)煩惱著大多數人,近來的調查顯示,93%的被調查者都對他們接收到的大量垃圾郵件非常不滿。一些簡單的垃圾郵件事件也造成了很有影響的安全問題。日益增加的垃圾郵件現在會造成1年94億美元的損失(來自 chinabyte上一則新聞的數據),在一些文章表明,垃圾郵件可能會花費一個公司內每個用戶600到1000美元。
垃圾郵件隨著互聯網的不斷發展而大量增長,不再像以前一樣,只是小小的一個騷擾,現在的垃圾郵件可以說是鋪天蓋地了。最初,垃圾郵件主要是一些不請自來的商業宣傳電子郵件,而現在更多的有關色情、政治的垃圾郵件不斷增加,甚至達到了總垃圾郵件量的40%左右,並且仍然有持續增長的趨勢。另一方面,垃圾郵件成了計算機病毒新的、快速的傳播途徑。
而且目前世界上50%的郵件都是垃圾郵件,只有少數組織承擔責任。很多反垃圾郵件的措施都被提出出來,但是只有非常少的被實施了。不幸的是,這些解決辦法也都還不能完全阻止垃圾郵件,而且還對正常的郵件來往產生影響。
1.1、什麼是垃圾郵件?
某種程度上,對垃圾郵件的定義可以是:那些人們沒有意願去接收到的電子郵件都是垃圾郵件。比如:
*商業廣告。很多公司為了宣傳新的產品、新的活動等通過電子郵件的方式進行宣傳。
*政治言論。目前會收到不少來自其他國家或者反動組織發送的這類電子郵件,這就跟垃圾的商業廣告一樣,銷售和販賣他們的所謂言論。
*蠕蟲病毒郵件。越來越多的病毒通過電子郵件來迅速傳播,這也的確是一條迅速而且有效的傳播途徑。
*惡意郵件。恐嚇、欺騙性郵件。比如phishing,這是一種假冒網頁的電子郵件,完全是一種詭計,來蒙騙用戶的個人信息、賬號甚至信用卡。
普通個人的電子郵箱怎麼成為了垃圾郵件的目標呢,造成這樣的結果有很多原因,比如在網站、論壇等地方注冊了郵件地址,病毒等在朋友的郵箱中找到了你的電子郵箱,對郵件提供商進行的用戶枚舉,等等。通常情況下,越少暴露電子郵件地址越少接收到垃圾郵件,使用時間越短越少接收到垃圾郵件。一些無奈的用戶就選擇了放棄自己的郵箱而更換新的電子郵箱。
1.2、安全問題
垃圾郵件給互聯網以及廣大的使用者帶來了很大的影響,這種影響不僅僅是人們需要花費時間來處理垃圾郵件、佔用系統資源等,同時也帶來了很多的安全問題。
垃圾郵件佔用了大量網路資源,這是顯而易見的。一些郵件伺服器因為安全性差,被作為垃圾郵件轉發站為被警告、封IP等事件時有發生,大量消耗的網路資源使得正常的業務運作變得緩慢。隨著國際上反垃圾郵件的發展,組織間黑名單共享,使得無辜伺服器被更大范圍屏蔽,這無疑會給正常用戶的使用造成嚴重問題。
垃圾郵件和黑客攻擊、病毒等結合也越來越密切,比如,SoBig蠕蟲就安裝開放的,可以用來支持郵件轉發的代理。隨著垃圾郵件的演變,用惡意代碼或者監視軟體等來支持垃圾郵件已經明顯地增加了。2003年12月31,巴西的一個黑客組織發送包含惡意javascript腳本的垃圾郵件給數百萬用戶,那些通過Hotmail來瀏覽這些垃圾郵件的人們在不知不覺中已經泄露了他們的賬號。另外一個例子就是,近來IE的URL顯示問題,在主機名前添加" %01"可以隱藏真實的主機地址,在被發布之後幾個星期內就出現在垃圾郵件中了。
越來越具有欺騙性的病毒郵件,讓很多企業深受其害,即便採取了很好的網路保護策略,依然很難避免,越來越多的安全事件都是因為郵件產生的,可能是病毒、木馬或者其他惡意程序。Phishing的假冒詭計對於普通使用者來說,的確很難作出正確的判斷,但是造成的損失卻是很直接的。
2、反垃圾郵件技術
已經存在的和在被提及的反垃圾郵件方法試圖來減少垃圾郵件問題和處理安全需求。通過正確的識別垃圾郵件,郵件病毒或者郵件攻擊程序等都會減少。這些解決方法採取多種安全途徑來努力阻止垃圾郵件。
Dr. Neal Krawetz在Anti-Spam Solutions and Security[ref 1]文中將反垃圾郵件技術作了非常好的分類。當前的反垃圾郵件技術可以分為4大類:過濾器(Filter)、反向查詢(Reverse lookup)、挑戰(challenges)和密碼術(cryptography),這些解決辦法都可以減少垃圾郵件問題,但是都有它們的局限性。本文將在下面的內容討論這些技術以及一些主要技術的實現。
2.1、過濾
過濾(Filter)是一種相對來說最簡單卻很直接的處理垃圾郵件技術。這種技術主要用於接收系統(MUA,如OUTLOOK EXPRESS或者MTA,如sendmail)來辨別和處理垃圾郵件。從應用情況來看,這種技術也是使用最廣泛的,比如很多郵件伺服器上的反垃圾郵件插件、反垃圾郵件網關、客戶端上的反垃圾郵件功能等,都是採用的過濾技術。
2.1.1、關鍵詞過濾
關鍵詞過濾技術通常創建一些簡單或復雜的與垃圾郵件關聯的單詞表來識別和處理垃圾郵件。比如某些關鍵詞大量出現在垃圾郵件中,如一些病毒的郵件標題,比如:test。這種方式比較類似反病毒軟體利用的病毒特徵一樣。可以說這是一種簡單的內容過濾方式來處理垃圾郵件,它的基礎是必須創建一個龐大的過濾關鍵詞列表。
這種技術缺陷很明顯,過濾的能力同關鍵詞有明顯聯系,關鍵詞列表也會造成錯報可能比較大,當然系統採用這種技術來處理郵件的時候消耗的系統資源會比較多。並且,一般躲避關鍵詞的技術比如拆詞,組詞就很容易繞過過濾。
2.1.2、黑白名單
黑名單(Black List)和白名單(White List)。分別是已知的垃圾郵件發送者或可信任的發送者IP地址或者郵件地址。現在有很多組織都在做*bl(block list),將那些經常發送垃圾郵件的IP地址(甚至IP地址范圍)收集在一起,做成block list,比如spamhaus的SBL(Spamhaus Block List),一個BL,可以在很大范圍內共享。許多ISP正在採用一些組織的BL來阻止接收垃圾郵件。白名單則與黑名單相反,對於那些信任的郵件地址或者 IP就完全接受了。
目前很多郵件接收端都採用了黑白名單的方式來處理垃圾郵件,包括MUA和MTA,當然在MTA中使用得更廣泛,這樣可以有效地減少伺服器的負擔。
BL技術也有明顯的缺陷,因為不能在block list中包含所有的(即便是大量)的IP地址,而且垃圾郵件發送者很容易通過不同的IP地址來製造垃圾。
2.1.3 HASH技術
HASH技術是郵件系統通過創建HASH來描述郵件內容,比如將郵件的內容、發件人等作為參數,最後計算得出這個郵件的HASH來描述這個郵件。如果HASH相同,那麼說明郵件內容、發件人等相同。這在一些ISP上在採用,如果出現重復的HASH值,那麼就可以懷疑是大批量發送郵件了。
2.1.4 基於規則的過濾
這種過濾根據某些特徵(比如單詞、片語、位置、大小、附件等)來形成規則,通過這些規則來描述垃圾郵件,就好比IDS中描述一條入侵事件一樣。要使得過濾器有效,就意味著管理人員要維護一個龐大的規則庫。
2.1.5 智能和概率系統
廣泛使用的就是貝葉斯(Bayesian)演算法,可以學習單詞的頻率和模式,這樣可以同垃圾郵件和正常郵件關聯起來進行判斷。這是一種相對於關鍵字來說,更復雜和更智能化的內容過濾技術。我將在下面詳細描述這種在客戶端和伺服器中使用最廣泛的技術。
2.1.5.1 Bayesian 貝葉斯演算法
在過濾器中,現在表現最好的應該是基於評分(score)的過濾器,因為我們很容易就可以明白對付狡猾的垃圾郵件,那些黑白名單、關鍵詞庫或者 HASH等過濾器是多麼的簡單。評分系統過濾器是一種最基本的演算法過濾器,也是貝葉斯演算法的基本雛形。它的原理就是檢查垃圾郵件中的詞或字元等,將每個特徵元素(最簡單的元素就是單詞,復雜點的元素就是短語)都給出一個分數(正分數),另一方面就是檢查正常郵件的特徵元素,用來降低得分的(負分數)。最後郵件整體就得到一個垃圾郵件總分,通過這個分數來判斷是否spam。
這種評分過濾器盡量實現了自動識別垃圾郵件的功能,但是依然存在一些不適應的問題:
*特徵元素列表通過垃圾郵件或者正常郵件獲得。因此,要提高識別垃圾郵件的效果,就要從數百郵件中來學習,這降低了過濾器效率,因為對於不同人來說,正常郵件的特徵元素是不一樣的。
*獲得特徵元素分析的郵件數量多少是一個關鍵。如果垃圾郵件發送者也適應了這些特徵,就可能讓垃圾郵件更象正常郵件。這樣的話,過濾特徵就要更改了。
*每個詞計算的分數應該基於一種很好的評價,但是還是有隨意性。比如,特徵就可能不會適應垃圾郵件的單詞變化,也不會適應某個用戶的需要。
貝葉斯理論現在在計算機行業中應用相當廣泛,這是一種對事物的不確定性描述,比如google計算中就採用了貝葉斯理論。貝葉斯演算法的過濾器就是計算郵件內容中成為垃圾郵件的概率,它要首先從許多垃圾郵件和正常郵件中進行學習,因此,效果將比普通的內容過濾器更優秀,錯報就會更少。貝葉斯過濾器也是一種基於評分的過濾器。但不僅僅是一種簡單的計算分數,而更從根本上來識別。它採用自動建立特徵表的方式,原理上,首先分析大量的垃圾郵件和大量的正常郵件,演算法分析郵件中多種特徵出現概率。
貝葉斯演算法計算特徵的來源通常是:
·郵件正文中的單詞
·郵件頭(發送者、傳遞路徑等)
·其他表現,比如HTML編碼(如顏色等)
·片語、短語
·meta信息,比如特殊短語出現位置等
比如,正常郵件中經常出現單詞AAA,但是基本不在垃圾郵件中出現,那麼,AAA標示垃圾郵件的概率就接近0,反之則然。
貝葉斯演算法的步驟為:
1. 收集大量的垃圾郵件和非垃圾郵件,建立垃圾郵件集和非垃圾郵件集。
2. 提取特徵來源中的獨立字元串,例如 AAA等作為TOKEN串並統計提取出的TOKEN串出現的次數即字頻。按照上述的方法分別處理垃圾郵件集和非垃圾郵件集中的所有郵件。
3. 每一個郵件集對應一個哈希表,hashtable_good對應非垃圾郵件集而hashtable_bad對應垃圾郵件集。表中存儲TOKEN串到字頻的映射關系。
4. 計算每個哈希表中TOKEN串出現的概率P=(某TOKEN串的字頻)/(對應哈希表的長度)
5. 綜合考慮hashtable_good和hashtable_bad,推斷出當新來的郵件中出現某個TOKEN串時,該新郵件為垃圾郵件的概率。數學表達式為:
A 事件 ---- 郵件為垃圾郵件;
t1,t2 …….tn 代表 TOKEN 串
則 P(A|ti)表示在郵件中出現 TOKEN 串 ti 時,該郵件為垃圾郵件的概率。設
P1(ti)=ti 在 hashtable_good 中的值
P2(ti)=ti 在 hashtable_ bad 中的值
則 P(A|ti)=P2(ti)/[(P1(ti)+P2(ti)] ;
6. 建立新的哈希表hashtable_probability存儲TOKEN串ti到P(A|ti)的映射
7.根據建立的哈希表 hashtable_probability可以估計一封新到的郵件為垃圾郵件的可能性。
當新到一封郵件時,按照步驟2,生成TOKEN串。查詢hashtable_probability得到該TOKEN 串的鍵值。假設由該郵件共得到N個TOKEN 串,t1,t2…….tn,hashtable_probability中對應的值為 P1 ,P2 ,……PN ,P(A|t1 ,t2, t3……tn) 表示在郵件中同時出現多個TOKEN串t1,t2……tn時,該郵件為垃圾郵件的概率。
由復合概率公式可得:
P(A|t1 ,t2, t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)]
當 P(A|t1 ,t2, t3……tn) 超過預定閾值時,就可以判斷郵件為垃圾郵件。
當新郵件到達的時候,就通過貝葉斯過濾器分析,通過使用各個特徵來計算郵件是spam的概率。通過不斷的分析,過濾器也不斷地獲得自更新。比如,通過各種特徵判斷一個包含單詞AAA的郵件是spam,那麼單詞AAA成為垃圾郵件特徵的概率就增加了。
這樣,貝葉斯過濾器就有了自適應能力,既能自動進行,也可以用戶手工操作,也就更能適應單個用戶的使用。而垃圾郵件發送者要獲得這樣的適應能力就很難了,因此,更難逃避過濾器的過濾,但他們當然還是能夠將郵件偽裝成很普遍的正常郵件的樣子。除非垃圾郵件發送者能去對某個人的過濾器進行判斷,比如,採用發送回執的辦法來了解哪些郵件被用戶打開了等,這樣他們就可以適應過濾器了。
雖然貝葉斯過濾器還存在有評分過濾器的缺陷,但是它更優化了。實踐也證明,貝葉斯過濾器在客戶端和伺服器中效果是非常明顯的,優秀的貝葉斯過濾器能夠識別超過99.9%的垃圾郵件。大多數目前應用的反垃圾郵件產品都採用了這樣的技術。比如Foxmail中的貝葉斯過濾。
2.1.6 局限性和缺點
現行的很多採用過濾器技術的反垃圾郵件產品通常都採用了多種過濾器技術,以便使產品更為有效。過濾器通過他們的誤報和漏報來分等級。漏報就是指垃圾郵件繞過了過濾器的過濾。而誤報則是將正常的郵件判斷為了垃圾郵件。完美的過濾器系統應該是不存在漏報和誤報的,但是這是理想情況。
一些基於過濾器原理的反垃圾郵件系統通常有下面的三種局限性:
·可能被繞過。垃圾郵件發送者和他們用的發送工具也不是靜態的,他們也會很快適應過濾器。比如,針對關鍵字列表,他們可以隨機更改一些單詞的拼寫,比如("強悍", "弓雖悍", "強-悍").Hash-buster(在每個郵件中產生不同的HASH)就是來繞過hash過濾器的。當前普遍使用的貝葉斯過濾器可以通過插入隨機單詞或句子來繞過。多數過濾器都最多隻能在少數幾周才最有效,為了保持反垃圾郵件系統的實用性,過濾器規則就必須不斷更新,比如每天或者每周更新。
·誤報問題。最頭痛的問題就是將正常郵件判斷為垃圾郵件。比如,一封包含單詞sample的正常郵件可能因此被判斷為垃圾郵件。某些正常伺服器不幸包含在不負責任的組織發布的block list對某個網段進行屏蔽中,而不是因為發送了垃圾郵件(xfocus的伺服器就是這樣的一個例子)。但是,如果要減少誤報問題,就可能造成嚴重的漏報問題了。
·過濾器復查。由於誤報問題的存在,通常被標記為垃圾郵件的消息一般不會被立刻刪除,而是被放置到垃圾郵件箱裡面,以便日後檢查。不幸的是,這也意味著用戶仍然必須花費時間去察看垃圾郵件,即便僅僅只針對郵件標題。
目前更嚴重的問題是,人們依然認為過濾器能有效阻止垃圾郵件。實際上,垃圾郵件過濾器並不能有效阻止垃圾郵件,在多數案例中,垃圾郵件依然存在,依然穿過了網路,並且依然被傳播。除非用戶不介意存在被誤報的郵件,不介意依然會瀏覽垃圾郵件。過濾器可以幫助我們來組織並分隔郵件為垃圾郵件和正常郵件,但是過濾器技術並不能阻止垃圾郵件,實際上只是在"處理"垃圾郵件。
盡管過濾器技術存在局限,但是,這是目前最為廣泛使用的反垃圾郵件技術。
2.2、驗證查詢
SMTP在設計的時候並沒有考慮到安全問題。在1973年,計算機安全還沒有什麼意義,那個時候能夠有一個可執行的郵件協議已經很了不起了。比如,RFC524描述將SMTP作為獨立協議的一些情況:
"雖然人們可以或者可能可以,以本文檔為基礎設計軟體,但請恰如其分地進行批註。請提出建議和問題。我堅信協議中依然存在問題,我希望讀者能夠閱讀RFC的時候能夠將它們都指出來。"
盡管SMTP的命令組已經發展了很長時間,但是人們還是以RFC524為基礎來執行SMTP的,而且還都假定問題(比如安全問題)都會在以後被解決。因此直到2004年,源自RFC524中的錯誤還是依然存在,這個時候SMTP已經變得非常廣泛而很難簡單被代替。垃圾郵件就是一個濫用SMTP協議的例子,多數垃圾郵件工具都可以偽造郵件頭,偽造發送者,或者隱藏源頭。
垃圾郵件一般都是使用的偽造的發送者地址,極少數的垃圾郵件才會用真實地址。垃圾郵件發送者偽造郵件有下面的幾個原因:
*因為是違法的。在多個國家內,發送垃圾郵件都是違法行為,通過偽造發送地址,發送者就可能避免被起訴。
*因為不受歡迎。垃圾郵件發送者都明白垃圾郵件是不受歡迎的。通過偽造發送者地址,就可能減少這種反應。
*受到ISP的限制。多數ISP都有防止垃圾郵件的服務條款,通過偽造發送者地址,他們可以減少被ISP禁止網路訪問的可能性。
因此,如果我們能夠採用類似黑白名單一樣,能夠更智能地識別哪些是偽造的郵件,哪些是合法的郵件,那麼就能從很大程度上解決垃圾郵件問題,驗證查詢技術正是基於這樣的出發點而產生的。以下還會解析一些主要的反垃圾郵件技術,比如Yahoo!、微軟、IBM等所倡導和主持的反垃圾郵件技術,把它們劃分在反向驗證查詢技術中並不是很恰當,但是,從某種角度來說,這些技術都是更復雜的驗證查詢。
2.2.1、反向查詢技術
從垃圾郵件的偽造角度來說,能夠解決郵件的偽造問題,就可以避免大量垃圾郵件的產生。為了限制偽造發送者地址,一些系統要求驗證發送者郵件地址,這些系統包括:
反向郵件交換(RMX)<http://www.ietf.org/internet-drafts/draft-danisch-dns-rr-smtp-03.txt>
發送者許可(SPF)<http://spf.pobox.com/>
標明郵件協議(DMP)<http://www.pan-am.ca/dmp/>
這些技術都比較相近。DNS是全球互聯網服務來處理IP地址和域名之間的轉化。在1986年,DNS擴展,並有了郵件交換紀錄(MX),當發送郵件的時候,郵件伺服器通過查詢MX紀錄來對應接收者的域名。
類似於MX紀錄,反向查詢解決方案就是定義反向的MX紀錄("RMX"--RMX,"SPF"--SPF,"DMP"--DMP),用來判斷是否郵件的指定域名和IP地址是完全對應的。基本原因就是偽造郵件的地址是不會真實來自RMX地址,因此可以判斷是否偽造。
2.2.2 DKIM技術
DKIM(DomainKeys Identified Mail)技術基於雅虎的DomainKeys驗證技術和思科的Internet Identified Mail。
雅虎的DomainKeys利用公共密鑰密碼術驗證電子郵件發件人。發送系統生成一個簽名並把簽名插入電子郵件標題,而接收系統利用DNS發布的一個公共密鑰驗證這個簽名。思科的驗證技術也利用密碼術,但它把簽名和電子郵件消息本身關聯。發送伺服器為電子郵件消息簽名並把簽名和用於生成簽名的公共密鑰插入一個新標題。而接收系統驗證這個用於為電子郵件消息簽名的公共密鑰是授權給這個發件地址使用的。
DKIM將把這兩個驗證系統整合起來。它將以和DomainKeys相同的方式用DNS發布的公共密鑰驗證簽名,它也將利用思科的標題簽名技術確保一致性。
DKIM給郵件提供一種機制來同時驗證每個域郵件發送者和消息的完整性。一旦域能被驗證,就用來同郵件中的發送者地址作比較檢測偽造。如果是偽造,那麼可能是spam或者是欺騙郵件,就可以被丟棄。如果不是偽造的,並且域是已知的,可為其建立起良好的聲譽,並綁定到反垃圾郵件策略系統中,也可以在服務提供商之間共享,甚至直接提供給用戶。
對於知名公司來說,通常需要發送各種業務郵件給客戶、銀行等,這樣,郵件的確認就顯得很重要。可以保護避免受到phishing攻擊。
現在,DKIM技術標准提交給IETF,可以參考draft文檔http://www.ietf.org/internet-drafts/draft-delany-domainkeys-base-00.txt
DomainKeys的實現過程
發送伺服器經過兩步:
1、建立。域所有者需要產生一對公/私鑰用於標記所有發出的郵件(允許多對密鑰),公鑰在DNS中公開,私鑰在使用DomainKey的郵件伺服器上。
2、簽名。當每個用戶發送郵件的時候,郵件系統自動使用存儲的私鑰來產生簽名。簽名作為郵件頭的一部分,然後郵件被傳遞到接收伺服器上。
接收伺服器通過三步來驗證簽名郵件:
1、准備。接收伺服器從郵件頭提取出簽名和發送域(From:)然後從DNS獲得相應的公鑰。
2、驗證。接收伺服器用從DNS獲得的公鑰來驗證用私鑰產生的簽名。這保證郵件真實發送並且沒有被修改過。
3、傳遞。接收伺服器使用本地策略來作出最後結果,如果域被驗證了,而且其他的反垃圾郵件測試也沒有決定,那麼郵件就被傳遞到用戶的收件箱中,否則,郵件可以被拋棄、隔離等。
2.2.3、SenderID技術
2004年,Gates曾信誓旦旦地預言微軟能夠在未來消滅垃圾郵件,他所期望的就是Sender ID技術,但是,最近他則收回了他的預言。這也就是標准之爭,微軟希望IETF能夠採用Sender ID技術作為標准,並且得到了大量支持,比如Cisco, Comcast, IBM, Cisco,Port25,Sendmail,Symantec,VeriSign等,也包括後來又倒戈的AOL的支持,但是在開源社區,微軟一直沒有得到足夠的支持,IETF最終否決了微軟的提議。
SenderID技術主要包括兩個方面:發送郵件方的支持和接收郵件方的支持。其中發送郵件方的支持主要有三個部分:發信人需要修改郵件伺服器的 DNS,增加特定的SPF記錄以表明其發信身份,比如"v=spf1 ip4:192.0.2.0/24 -all",表示使用SPF1版本,對於192.0.2.0/24這個網段是有效的;在可選情況下,發信人的MTA支持在其外發郵件的發信通信協議中增加 SUBMITTER等擴展,並在其郵件中增加Resent-Sender、Resent-From、Sender等信頭。
接收郵件方的支持有:收信人的郵件伺服器必須採用SenderID檢查技術,對收到的郵件檢查PRA或MAILFROM,查詢發件者DNS的SPF紀錄,並以此驗證發件者身份。
因此,採用Sender ID技術,其整個過程為:
第一步,發件人撰寫郵件並發送;
第二步,郵件轉移到接收郵件伺服器;
第三步,接收郵件伺服器通過SenderID技術對發件人所聲稱的身份進行檢查(該檢查通過DNS的特定查詢進行);
第四步,如果發現發信人所聲稱的身份和其發信地址相匹配,那麼接收該郵件,否則對該郵件採取特定操作,比如直接拒收該郵件,或者作為垃圾郵件。
Sender ID技術實際上並不是根除垃圾郵件的法寶,它只是一個解決垃圾郵件發送源的技術,從本質上來說,並不能鑒定一個郵件是否是垃圾郵件。比如,垃圾郵件發送者可以通過注冊廉價的域名來發送垃圾郵件,從技術的角度來看,一切都是符合規范的;還有,垃圾郵件發送者還可以通過別人的郵件伺服器的漏洞轉發其垃圾郵件,這同樣是SenderID技術所不能解決的。
2.2.4、FairUCE技術
FairUCE(Fair use of Unsolicited Commercial Email)由IBM開發,該技術使用網路領域的內置身份管理工具,通過分析電子郵件域名過濾並封鎖垃圾郵件。
FairUCE把收到的郵件同其源頭的IP地址相鏈接--在電子郵件地址、電子郵件域和發送郵件的計算機之間建立起一種聯系,以確定電子郵件的合法性。比如採用SPF或者其他方法。如果,能夠找到關系,那麼檢查接受方的黑白名單,以及域名名聲,以此決定對該郵件的操作,比如接收、拒絕等。
FairUCE還有一個功能,就是通過溯源找到垃圾郵件的發送源頭,並且將那些傳遞過來的垃圾郵件再轉回給發送源頭,以此來打擊垃圾郵件發送者。這種做法利弊都有。好處就是能夠影響垃圾郵件發送源頭的性能,壞處就是可能打擊倒正常的伺服器(比如被利用的)的正常工作,同時該功能又復制了大量垃圾流量。
2.2.5、局限性和缺點
這些解決方案都具有一定的可用性,但是也存在一些缺點:
**非主機或空的域名
反向查詢方法要求郵件來自已知的並且信任的郵件伺服器,而且對應合理IP地址(反向MX紀錄)。但是,多數的域名實際上並不同完全靜態的IP地址對應。通常情況下,個人和小公司也希望擁有自己的域名,但是,這並不能提供足夠的IP地址來滿足要求。DNS注冊主機,比如GoDaddy,向那些沒有主機或只有空域名的人提供免費郵件轉發服務。盡管這種郵件轉發服務只能管理接收的郵件,而不能提供郵件發送服務。
反向查詢解決方案對這些沒有主機或者只有空域名的用戶造成一些問題:
·沒有反向MX記錄。這些用戶現在可以配置郵件客戶端就可以用自己注冊的域名能發送郵件。但是,要反向查詢發送者域名的IP地址就根本找不到。特別是對於那些移動的、撥號的和其他會頻繁改變自己IP地址的用戶。
·不能發送郵件。要解決上面的問題,一個辦法就是通過ISP的伺服器來轉發郵件,這樣就可以提供一個反向MX紀錄,但是,只要發送者的域名和ISP的域名不一樣的時候,ISP現在是不會允許轉發郵件的。
這兩種情況下,這些用戶都會被反向查詢系統攔截掉。
**合法域名
能驗證身份,並不一定就是合法的身份,比如:垃圾郵件發送者可以通過注冊廉價的域名來發送垃圾郵件,從技術的角度來看,一切都是符合規范的;還有,目前很多垃圾郵件發送者可以通過別人的郵件伺服器漏洞進入合法郵件系統來轉發其垃圾郵件,這些問題對於驗證查詢來說還無法解決。
2.3、挑戰
垃圾郵件發送者使用一些自動郵件發送軟體每天可以產生數百萬的郵件。挑戰的技術通過延緩郵件處理過程,將可以阻礙大量郵件發送者。那些只發送少量郵件的正常用戶不會受到明顯的影響。但是,挑戰的技術只在很少人使用的情況下獲得了成功。如果在更普及的情況下,可能人們更關心的是是否會影響到郵件傳遞而不是會阻礙垃圾郵件。
這里介紹兩種主要的挑戰形式:挑戰-響應,和 計算性挑戰(challenge-response and proposed computational challenges)
2.3.1 挑戰-響應
挑戰-響應(Challenge-Response:CR)系統保留著許可發送者的列表。一個新的郵件發送者發送的郵件將被臨時保留下來而不立即被傳遞
參考資料:http://www.xfocus.net/articles/200508/818.html
㈢ 求貝葉斯演算法基於英文郵件文本分類的java代碼
以前做過,這個直接谷歌一下就能找到不少資料。提醒你一點,做垃圾過濾不用很多attribute。
㈣ 什麼是貝葉斯過濾
貝葉斯過濾器(Bayesian filter)通過使用貝葉斯邏輯(或稱貝葉斯分析法)內,對郵件的標題和內容進行分析,從而判斷容郵件是否是垃圾郵件。 貝葉斯過濾器不是萬能的。垃圾郵件一般包含有特定的文字,貝葉斯過濾器需要進行一段時間的學習,才能對垃圾郵件做出有效的攔截。貝葉斯過濾器會根據概率把郵件分類,比如:信任郵件、可疑郵件等等。分類的類別可以由用戶自己定義。 貝葉斯過濾器最好能與反病毒軟體協同工作。
㈤ 貝葉斯演算法能做什麼 python
貝葉斯分類演算法的設計與實現 求源碼 最好能處理圖像型垃圾郵件
㈥ 反垃圾郵件怎麼攔截jp的垃圾
樓主好:
不知道您使用的是什麼郵箱,我用的QQ郵箱專門設置了多重途徑處理垃圾郵件,在被舉報次數達到一定數額後,還會對發信人處以封號等措施。QQ郵箱垃圾郵件的處理方法有:
一、在郵件列表中勾選需要拒絕的郵件。點擊「舉報垃圾郵件」按鈕,則會將該郵件移到垃圾郵件箱,並將發件人地址加入黑名單,以後就不會收到此發件人發送的垃圾郵件。如果您用電子郵件客戶端將郵件下載到了本地,並且發現了垃圾郵件,可以用您的客戶端軟體中提供的工具來設置拒收。
黑名單的作用是:將一個郵件地址添加到黑名單,就不會再收到該地址發來的信件,有效防止垃圾廣告郵件。將一個域名添加到黑名單,就不會再收到該域名下各個郵箱發來的信件,能夠有效攔截同一個域名下的各個郵箱的來信。
白名單的作用是:將一個郵件地址添加到白名單後,該地址發來的信件將不受反垃圾規則的影響,保證您一定能收到來自該地址的郵件。將一個域名添加到白名單後,該域名下各個郵箱發來的信件都將不受反垃圾規則的影響,保證您能收到同一個域名下各個郵箱發來的信件。
您可以根據自己的需求進行設置。
如果還是不能解決您的問題,歡迎繼續追問我哦!
望採納!!
㈦ 郵件伺服器對垃圾郵件的識別機制是什麼
關鍵詞過濾、發送頻率過濾、域名信譽度、IP信譽度,其他智能演算法等;另外就是對郵件的代碼也有限制。
㈧ 求becky郵件客戶端,阻止垃圾郵件插件。
http://www.epcboy.com/post/110.html 到這個地方看看,概述 BkASPil是針對Becky! Internet Mail開發的一款垃圾郵件對策插件。功能強勁,主要採用貝葉斯計算過濾(分發)、網路黑名單參照過濾(垃圾郵件的上報)的方式。 具有以下特點: 貝葉斯過濾功能; 垃圾郵件學習,構建垃圾郵件資料庫; 正常郵件學習,構建正常郵件資料庫; 黑名單參照方式; spam登錄,構建用戶網路共享資料庫。
㈨ foxmail7的貝葉斯過濾,不小心把垃圾郵件學成非垃圾郵件,造成有些垃圾郵件沒欄住,不用「清空」怎麼解決
多重復幾次把垃圾郵件再學習成垃圾郵件,即可。
`了解更多郵箱問題請到中國郵箱網。
㈩ 貝葉斯垃圾郵件過濾源碼
http://sourceforge.net/projects/spampalbayes/
http://search.codesoso.com/default.aspx
在這里有
http://www.codeproject.com/KB/recipes/BayesianCS.aspx