【论文标题】Combating Web Spam with TrustRank (Proceedings 2004 VLDB Conference)

【论文作者】Zolt´an Gy¨ongyi,Hector Garcia-Molina, Jan Pedersen

【论文链接】Paper (12-pages // Double column) https://www.sciencedirect.com/science/article/pii/B9780120884698500528

      PaperBDY(21-pages // Single column)

【摘要】

  Web垃圾邮件页面使用各种技术在搜索引擎的结果中获得高于应得的排名。虽然人类专家可以识别垃圾邮件,但手动评估大量页面的成本太高了。相反,我们建议使用一些技术,将有信誉的、好的页面与垃圾邮件分离开来。我们首先选择一组小的种子页,由专家来评估。一旦我们手动识别有信誉的种子页面,我们就会使用web的链接结构来覆盖其他可能很好的页面。在本文中,我们讨论了实现种子选择和发现好的页面的可能方法。我们展示了在AltaVista索引的万维网上运行的实验结果,并评估我们的技术的性能。我们的结果表明,我们可以有效地过滤掉大量网络上的垃圾邮件,这是基于一个不到200个站点的良好种子集。

转载于:https://www.cnblogs.com/shenxiaolin/p/9267531.html

【DM】Combating Web Spam with TrustRank - 用TrustRank对抗网络垃圾邮件相关推荐

  1. 搜索引擎web spam类型及防治策略(version 0.9)

    /*版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明 .*/ 搜索引擎web spam类型及防治策略(version 0.9) 中科院软件所 张俊林 url:http ...

  2. Spam(垃圾邮件)

    Spam(垃圾邮件)<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /&g ...

  3. [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(BERT)

    文章目录 1. 数据处理 2. 下载预训练模型 3. 加载数据 4. 定义模型 5. 训练 6. 提交测试结果 练习地址:https://www.kaggle.com/c/ds100fa19 相关博文 ...

  4. [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(RNN/GRU/LSTM)

    文章目录 1. 读入数据 2. 文本处理 3. 建模 4. 训练 5. 测试 练习地址:https://www.kaggle.com/c/ds100fa19 相关博文 [Kaggle] Spam/Ha ...

  5. [Kaggle] Spam/Ham Email Classification 垃圾邮件分类(spacy)

    文章目录 1. 导入包 2. 数据预览 2. 特征组合 3. 建模 4. 训练 5. 预测 练习地址:https://www.kaggle.com/c/ds100fa19 相关博文: [Kaggle] ...

  6. kali Linux Web 渗透测试视频教程— 第六课 网络扫描-nmap与zmap

    Kali Linux Web 渗透测试视频教程- 第六课 网络扫描-nmap与zmap 文/玄魂 目录 Kali Linux Web 渗透测试视频教程- 第六课 网络扫描-nmap与zmap. 1 N ...

  7. [Spam]垃圾邮件者纲要(Spammer's Compendium)

    (中文文字来源于"中国数字部落(DIGIBLOG_ORG) - 无关紧要的消息":http://digiblog.org/) (p.s.:Spammer's Compendium用 ...

  8. 19年8月 字母哥 第四章 常用web开发数据库框架 不要用公司网络加载不出来 用热点!!!

    第四章 常用web开发数据库框架 4.1.整合Spring JDBC操作数据 4.2 Spring JDBC多数据源的实现 4.3.Spring JDBC JTA实现分布式事务 4.4.ORM主流框架 ...

  9. Web前端--HTML+CSS+JavaScript响应式网络科技网页设计

    临近期末, 你还在为HTML网页设计结课作业,老师的作业要求感到头大?网页要求的总数量太多?HTML网页作业无从下手?没有合适的模板?等等一系列问题.你想要解决的问题,在这里常见网页设计作业题材有 个 ...

  10. 刀片服务器虚拟交换机,web client6.0设置刀片服务器虚拟机网络

    环境:vcenter 6.0:web client:联想Flex System Enterprise Chassis刀片服务器:登录刀片服务器远程控制界面,登录esxi,查看物理网卡的连接状态, QQ ...

最新文章

  1. 计算机 维修 pdf,简单计算机维修..pdf
  2. [luogu2042] [NOI2005]维护数列
  3. 直播丨2020数据技术嘉年华·金融峰会暨数据库大咖讲坛(第4期)
  4. oracle数据库标志物,Oracle表的分类以及相关参数的详解
  5. C语言小知识---递归函数的使用
  6. SystemVerilog 2005 语法
  7. 深度学习推理性能优化,一个越来越重要的话题
  8. A MULTI-TASK FRAMEWORK WITH FEATURE PASSING MODULE FOR SKIN LESION CLASSIFICATION AND SEGMENTATION
  9. 【相机标定系列】标定工具仓库
  10. cv2.error: OpenCV(4.5.3) :-1: error: (-5:Bad argument) in function ‘line‘ 报错解决
  11. Vbs脚本编程简明教程之五
  12. 学习笔记 | 零基础平面设计入门
  13. Airsim 无人机仿真
  14. BDTC 2017丨探索大数据在医疗行业的应用实践
  15. robot.txt是干嘛的?
  16. 工具推荐|2019年UI设计师必备工具清单
  17. 嵌入式系统考试题库(CSU)
  18. 37本国产SCI期刊推荐!涵盖9大领域,建议收藏!①
  19. 【分布式系统篇】链路追踪之Jaeger安装使用入门
  20. cad布局教程_【CAD布局教程】公装设计CAD施工图深化视频教程(移动设备无广告观看)...

热门文章

  1. 【长难句分析精讲】状语从句
  2. 【BZOJ1061】【NOI2008】志愿者招募 费用流神题、单纯形裸题(代码费用流)
  3. 潜在数学中 放眼数学外——记中国科学院院士、复旦大学教授李大潜zz
  4. IDEA Unable to import maven project: See logs for details具体解决方法
  5. 你真的不了解我的痛楚,请不要瞎说
  6. 关于自己学C的点滴记录
  7. 小程序 加快安卓手机向蓝牙设备发送大数据
  8. 去律师面试python_我的五次律所面试到底都经历了什么,这些真相……
  9. proof-carrying data from accumulation schemes学习笔记
  10. Connection reset by 20.205.243.166 port 22fatal: Could not read from remote repository.Please mak