{$cfg_webname}
主页 > 计算机 > 其他 >

垃圾信息过滤技术比较分析(附答辩)

来源:wenku163.com  资料编号:WK1639786 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9AWK1639786
资料介绍

垃圾信息过滤技术比较分析(附答辩)(含选题审批表,任务书,开题报告,中期检查表,毕业论文说明书20000字,答辩记录)

摘  要:垃圾信息问题已经受到了各界人士的广泛关注,本文总结了目前几种主流技术的研究现状,包括贝叶斯、决策树、粗糙集、黑白名单、SVM、Winnow等。分析各种方法的过滤原理、特征,总结分析它们实际过滤过程中的优缺点,从目前的研究结果看,贝叶斯、决策树、SVM等这些机器学习方法似乎可以达到较实用的程度,但是也有其自身的弊端,Winnow是一种很有前途的垃圾信息过滤技术。但在研究过程中也发现了一些问题,例如手机垃圾信息方面的过滤技术仍是弱点。
关键词:垃圾邮件过滤;垃圾信息;过滤技术

Comparative Analysis of Filtration Technology for Spam Information
Abstract:The spam problem has received extensive attention from all walks of life, the article summarizes the research status of several mainstream technology, including Bayesian, decision trees, rough sets, black and white lists, SVM, of Winnow. Analysis of the various methods of filtering theory, characteristics, summarize and analyze the advantages and disadvantages in their actual filtration process, to see results from the current study, Bayesian, Decision Tree, SVM and other machine learning methods seem to achieve a more practical level, but also has its own drawbacks, Winnow is a promising spam filtering technology. However, in the course of the study also found some problems, for example, the mobile spam filtering technology is still a weakness.
Key words:Spam filtering; Information garbage; Filtering technology

本文主要研究垃圾邮件的过滤技术,列举了几种目前运用较为广泛的垃圾邮件过滤技术,通过比较分析各种过滤技术在实际运用中所达到的效果,总结出不同的垃圾信息过滤技术各自的优点和不足之处。
第一章,对垃圾信息的定义、表现形式以及危害做出概述。
第二章,分析垃圾信息形成的原因及其特点,为垃圾信息过滤技术提供突破点。
第三章,分析垃圾邮件过滤技术的现状和发展趋势,了解目前的垃圾过滤技术水平及将来攻坚的主方向。
第四章,垃圾邮件过滤技术比较分析,举出了一包括黑白名单、贝叶斯算法、KNN、Winnow、粗糙集、决策树、Boosting、Ripper、SVM、基于图像信息、SMTP邮件防火墙在内的垃圾邮件过滤技术。也是本文的重点部分。
第五章,手机垃圾信息的过滤技术比较分析,从中发现目前关于手机垃圾信息的技术比较缺乏,这也是应该引起重视的地方。
第六章,总结全文。
 

垃圾信息过滤技术比较分析(附答辩)
垃圾信息过滤技术比较分析(附答辩)
垃圾信息过滤技术比较分析(附答辩)


目  录
摘  要    1
关键词    1
1  前言    2
2  垃圾信息概述    2
2.1  什么是垃圾信息    2
2.2  垃圾信息常见的表现形式    4
2.2.1  垃圾邮件    4
2.2.2  手机垃圾短信    5
2.3  垃圾信息的危害    5
2.3.1  严重浪费信息资源    5
2.3.2  危害社会秩序    5
2.3.3  影响人们的健康生活方式    6
3  垃圾邮件形成原因及特点    6
3.1  垃圾邮件形成的原因    6
3.1.1  经济利益    6
3.1.2  技术存在缺陷    6
3.1.3  防范意识淡薄    7
3.2  垃圾邮件的特点    7
3.2.1  伪装性强    7
3.2.2  变化性强    7
3.2.3  时效性强    7
4  垃圾邮件过滤技术的现状和发展趋势    7
5  垃圾邮件过滤技术    8
5.1  从方法上划分    9
5.1.1  白名单和黑名单    9
5.1.2  反向DNS域名验证    10
5.1.3  关键词匹配过滤    10
5.2  基于统计的划分    10
5.2.1  基于贝叶斯分类算法的过滤技术    10
5.2.2  基于KNN的过滤技术    12
5.2.3  基于Winnow的过滤技术    12
5.2.4  基于SVM的过滤技术    13
5.3  基于规则的划分    15
5.3.1  基于粗糙集的过滤技术    15
5.3.2  基于决策树算法的过滤技术    16
5.3.3  基于Boosting的过滤技术    17
5.3.4  基于Ripper的过滤技术    19
5.4  基于图像信息的过滤技术    19
5.4.1  分析邮件信头信息    19
5.4.2  图像的数字指纹技术    19
5.4.3  图像和文本结合技术    19
5.4.4  使用图像搜索技术    19
5.5  基于SMTP邮件防火墙的过滤技术    20
6  手机垃圾信息过滤技术    22
6.1  关键词过滤技术    22
6.2  短信文本分类技术    23
7  结论    24
参考文献    24
致    谢    25

推荐资料