会议
电子邮件及反垃圾邮件会议
内容:电子邮件与反垃圾邮件会议是一个学术会议。会议主要在以下领域发布:Spamming & Spambot。在其一生中,会议发表了285篇论文,收到了8777篇引用。
论文
学报的文章
•
[…]
TL;博士:本文的目标是分析这个语料库在探索如何对由人类组织的消息进行分类时的适用性,因此这些文件夹可能会产生误导。
文摘:大量的电子邮件信息,安然语料库,在对安然公司的法律调查期间被公开。该数据集,以及对其来源的彻底解释,可在http://www-2cscmuedu/~enron/上获得。本文提供了数据集的简要介绍和分析。原始安然语料库包含属于158个用户的619,446条消息。在分析之前,我们通过删除每个用户的某些文件夹来清理语料库。如“discussion_threads”这些文件夹在场对于大多数用户来说,似乎并没有被用户直接使用,而是计算机生成的很多,如“all_documents”,还包含了大量的重复的电子邮件,这已经出现在用户的其他文件夹我们本文的目标是分析的适用性语料库为探索如何分类信息由一个人,所以这些文件夹可能会被误导
652引用
学报的文章
•
TL;博士:采用了一种模拟个性化垃圾邮件过滤器增量训练的实验程序,并绘制了允许我们比较不同版本的nb在真阳性和真阴性之间的整个交易的roc曲线。
文摘:朴素贝叶斯在商业和开源的反垃圾邮件过滤器中非常流行。然而,有几种形式的朴素贝叶斯,一些反垃圾邮件文献并不总是承认。我们讨论了朴素贝叶斯的五个不同版本,并在六个新的非编码数据集上进行比较,这些数据集包含特定安然用户的虚假消息和新的垃圾消息。我们公开的新数据集比以前的可比基准更真实,因为它们保持了两类消息的节奏顺序,并且它们模拟了用户随时间收到的垃圾邮件和非垃圾邮件的不同比例。我们采用了一种实验程序,模拟个性化垃圾邮件过滤器的增量训练,我们绘制了roc曲线,允许我们在真阳性和真阴性之间的整个交易中比较不同版本的nb。
499引用
[…]
TL;博士:这篇论文使用了191个新鲜的不到30分钟的网络钓鱼,在8个反网络钓鱼工具栏上进行了两次测试,发现使用启发式补充黑名单的两种工具最初捕获的网络钓鱼明显多于仅使用黑名单的工具。
文摘:本文研究了网络钓鱼黑名单的有效性。我们使用了191个新出现的不到30分钟的网络钓鱼,对8个反网络钓鱼工具栏进行了两次测试。我们发现,在我们的数据集中,63%的网络钓鱼活动持续时间不到两个小时。黑名单在最初保护用户时是不明智的,因为大多数人在开始时只捕获了不到20%的网络钓鱼。我们还发现黑名单的更新速度不同,覆盖范围也不同,47% - 83%的网络钓鱼在初始测试12小时后出现在黑名单上。我们发现,两种使用启发式来补充黑名单的工具,最初比仅使用黑名单的工具捕获了更多的网络钓鱼。然而,启发式检测到的钓鱼需要很长时间才能出现在黑名单上。最后,我们在一组13,458个合法url上测试了工具栏的误报情况,没有发现任何黑名单或启发式错误标记的实例。我们提出这些发现,并讨论如何改进反钓鱼工具。
327引用
学报的文章
•
一月一日
TL;博士:一个端到端的系统,根据用户的电子邮件收件箱提取用户的社交网络及其成员的联系信息,并讨论了该系统在地址簿填充、专家查找和社交网络分析方面的功能。
文摘::我们提出了一个端到端系统,根据用户的电子邮件收件箱提取用户的社交网络及其成员的联系信息。系统在电子邮件中识别独特的人,查找他们的Web状态,并使用条件随机场自动填充联系人地址簿的字段,这种概率模型非常适合这种信息提取任务。通过递归地调用在Web上发现的新用户,该系统构建了一个与用户有多重分离的社交网络。必威体育BW此外,还提取了一组描述专业知识的关键字,并与每个人相关联。我们概述了使该系统成为可能的收集统计和学习组件,并在两个用户的真实电子邮件上给出了实验结果;我们还给出了一个简单的学习迁移方法的结果,并讨论了该系统在地址簿填充、专家查找和社会网络分析方面的能力。
296引用
学报的文章
•
[…]
华盛顿大学
1
TL;博士:主动和被动的好词攻击的有效性对两种类型的统计垃圾邮件过滤器:朴素贝叶斯和最大熵过滤器进行了描述和评估。
文摘:对于电子邮件服务的用户和提供商来说,未经请求的商业电子邮件是一个重大问题。虽然统计垃圾邮件过滤器已被证明是有用的,但垃圾邮件发送者正在学习通过系统地修改他们的电子邮件信息来绕过这些过滤器。在最常见的技术之一“好词攻击”中,垃圾邮件发送者通过插入或添加表明合法电子邮件的单词来修改垃圾邮件。在本文中,我们描述和评估了主动和被动好词攻击对两种类型的统计垃圾邮件过滤器的有效性:朴素贝叶斯和最大熵过滤器。我们发现,在没有任何过滤器反馈的被动攻击中,攻击者可以通过添加150个单词或更少的单词,使50%当前被拦截的垃圾邮件通过过滤器。在允许对目标过滤器进行测试查询的主动攻击中,30个单词将通过任一过滤器获得一半的拦截垃圾邮件。
284引用