我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

四川省德昌县人民检察院起诉书指控:

2014年至今,被告人李文环使用“爬虫”软件,大量爬取全国各地及凉山州公安局交警支队车管所公告的车牌放号信息,之后使用软件采用多线程提交、批量刷单、验证码自动识别等方式,突破系统安全保护措施,将爬取的车牌号提交至“交通安全服务管理平台”车辆报废查询系统,进行对比,并根据反馈情况自动记录未注册车牌号,建立全国未注册车牌号数据库。李文环之后编写客户端查询软件,由李文环通过QQ、淘宝、微信等方式,以300-3000元每月的价格,分省市贩卖数据库查阅权限。其中将软件卖给李某2,非法选取凉山州车牌三个(WQQ777、WQJ777、WQX999);将软件卖给李某1,非法选取凉山州车牌1个(WQD777)。被告人吴杰明知李文环使用非法手段获取未注册车牌信息,而购买抢号软件、查库软件,非法选取四个成都市车牌号码(A5432F、A6543J、A4777、DAS456)。

2016年6月至今,被告人王硕编写使用软件登录“交通安全服务管理平台”,大量爬取全国各地及凉山州公安局交警支队车管所公告的车牌放号信息,使用软件突破系统安全保护措施,将爬取的车牌号提交至“交通安全服务管理平台”车辆违章查询系统,进行对比,并根据反馈情况自动记录未注册车牌号,建立全国未注册车牌号数据库。王硕编写客户端查询软件,由卢晓燕通过淘宝、微信等方式,以20元每48小时的价格,分省市贩卖数据库查阅权限。王硕、栾东超、卢晓燕在全国范围内招募徐明、吴杰等各省选车牌号下线代理人,并招揽客户,提供身份证号码、车架号等信息,比对未注册车牌号数据库使用抢号软件采用多线程登录,编辑“按键精灵”类软件模拟人工操作,编辑验证码自动识别输入,实现快速抢号,之后选取车牌贩卖。

被告人徐明、吴杰明知栾东超、王硕等人采用软件等非法手段获取未注册车牌数据库,而向栾东超提供由蒋某、唐某、曹某、韦某提供给的凉山州车主身份证号码、车架号,栾东超又将信息提交给王硕以选取车牌(WPX999、WQC888、WQE666、WQK777、WPQ888、WQK888、WPF888)。被告人吴杰在案发后提供线索揭发他人犯罪行为,经查证属实。被告人卢晓燕在案发后协助公安机关成功抓捕同案其他被告人。被告人栾东超在案发后主动到公安机关投案自首,并如实供述自己的犯罪事实。

公诉机关认为,被告人李文环、王硕、卢晓燕、栾东超、徐明、吴杰为牟取私利,违法国家规定,侵入国家事务领域的计算机信息系统,其行为均已触犯《中华人民共和国刑法》第二百八十五条第一款之规定,应当以非法侵入计算机信息系统罪追究其刑事责任。被告人王硕、卢晓燕、栾东超、徐明、吴杰的行为同时适用《中华人民共和国刑法》第二十五条第一款关于共同犯罪的规定。被告人吴杰、卢晓燕的行为适用《中华人民共和国刑法》第六十八条关于立功的规定。被告人栾东超的行为适用《中华人民共和国刑法》第六十七条关于自首的规定。在开庭审理前,公诉机关向本院提交了本案不宜区分主从的补充说明。对指控的事实,公诉机关当庭出示了相关证据予以证实。

被告人李文环、王硕、卢晓燕、栾东超、徐明、吴杰,以及李文环、王硕、吴杰的辩护人对起诉书指控的罪名和事实、当庭出示的证据均无异议,且在法庭上均无证据出示。六被告人当庭自愿认罪认罚,被告人及其辩护人均请求对被告人从轻处罚。

判决情况

四川省德昌县人民法院认为,被告人李文环、王硕、卢晓燕、栾东超、徐明、吴杰为牟取私利,违法国家规定,侵入国家事务领域的计算机信息系统,六被告人的行为均已构成非法侵入计算机信息系统罪。德昌县人民检察院指控六被告人的罪名成立,法院予以支持。在对六被告人量刑时,将根据各被告人的犯罪事实、性质、情节及对社会的危害程度,依法对其进行处罚。公诉机关对六被告人提出的量刑建议与其所犯罪行的事实、情节相适应,法院予以采纳。为此,依照《中华人民共和国刑法》第二百八十五条第一款、第二十五条第一款、第六十八条、第六十七条第一款、第三款、第六十四条、第四十七条之规定,判决如下:

1、被告人李文环犯非法侵入计算机信息系统罪,判处有期徒刑一年零七个月;
2、被告人王硕犯非法侵入计算机信息系统罪,判处有期徒刑一年四个月零十五日;
3、被告人卢晓燕犯非法侵入计算机信息系统罪,判处有期徒刑一年四个月零五日;
4、被告人栾东超犯非法侵入计算机信息系统罪,判处有期徒刑一年四个月零五日;
5、被告人徐明犯非法侵入计算机信息系统罪,判处有期徒刑一年四个月零十五日;
6、被告人吴杰犯非法侵入计算机信息系统罪,判处有期徒刑十个月。

判决文书:https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=tLWwykCoBI7CE+7wbk+KhjbZWY5Yu2Ax+Kvuqf0ElZ7GDrMXr7cQyvUKq3u+IEo4XqsAcAjMpO8oPcXkV9hAVsatoixhCK3qAazPhcV8jmxKNtJuJ5df5yARNV2eaRUI

反思总结

在司法实务中,法院对于“侵入”行为的认定,主要考量是否存在超越权限、对系统的正常运行产生影响等情形。对于大数据服务公司而言,其在运用爬虫技术抓取国家企业信用信息公示系统、中国执行信息公开网等公开数据时,风险点在于是否对目标系统的正常运行产生影响。在被爬网站已经采取反爬虫技术的情况下,如果恶意破解反爬虫技术抓取数据,进而对网站运行造成影响的,则可能构成非法侵入计算机信息系统罪。

【K哥爬虫普法】蓄意突破反爬虫技术,爬取牌照信息相关推荐

  1. Python实践 - 网络爬虫笔记 - 2、从网站上爬取公开信息

    Python实践笔记 - 2.从网站上爬取公开信息 张板书的Python的实践笔记,包括笔记与DeBug的经历. 为了完成一个比较麻烦的实习任务,尝试着做了这样一个爬虫项目. 任务要求之一是要检索安徽 ...

  2. 【k哥爬虫普法】程序员183并发爬取官方网站,直接获刑3年?

    我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了"K哥爬虫普法"专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识, ...

  3. python反爬虫策略_突破反爬虫策略

    ### 1.什么是爬虫和反爬虫 * **爬虫**是使用任何技术手段批量获取网站信息的一种方式,**反爬虫**是使用任何技术手段阻止别人批量获取自己网站信息的一种方式: ### 2.User-Agent ...

  4. 正经网站爬虫实战,如何快速使用Selenium爬取租房信息

    租房信息爬虫实战 摘要 1.技术选型 1.1 Selenium 1.2 MySql 2 程序思路 3 程序实现(python selenium) 3.1 引入需要的包 3.2 初始化驱动和数据库连接 ...

  5. 爬虫学习笔记(一):爬取书籍信息

    爬取爬虫练习网站的书籍信息 专门供爬虫初学者训练爬虫技术的网站(http://books.toscrape.com) 我使用的浏览器是Google Chrome浏览器 1. 创建项目 首先,我们要创建 ...

  6. 利用java的JSoup爬虫技术爬取网页信息

    简单讲解java的Jsoup爬虫技术来爬取网页的数据,简单来讲就是解释网页,一般学过xml的人都很容易理解. 第一步:我们要爬取网页的静态内容必须要了解网页的源码,也就是div之类的标签,因为我们是靠 ...

  7. python爬虫影评_Python爬虫(二十)_动态爬取影评信息

    本案例介绍从JavaScript中采集加载的数据.更多内容请参考:Python学习指南 #-*- coding:utf-8 -*- import requests import re import t ...

  8. Python 爬取网页信息并保存到本地爬虫爬取网页第一步【简单易懂,注释超级全,代码可以直接运行】

    Python 爬取网页信息并保存到本地[简单易懂,代码可以直接运行] 功能:给出一个关键词,根据关键词爬取程序,这是爬虫爬取网页的第一步 步骤: 1.确定url 2.确定请求头 3.发送请求 4.写入 ...

  9. python爬虫反爬机制_Python Scrapy突破反爬虫机制(项目实践)

    对于 BOSS 直聘这种网站,当程序请求网页后,服务器响应内容包含了整个页面的 HTML 源代码,这样就可以使用爬虫来爬取数据.但有些网站做了一些"反爬虫"处理,其网页内容不是静态 ...

最新文章

  1. 数据录入工作,使用VBA
  2. c# Application.DoEvents
  3. 科大星云诗社动态20210510
  4. 《自卑与超越》读书笔记(part6)--职业有些时候成为了人们逃避爱情和社会问题的借口
  5. C# Web实时消息后台服务器推送技术-GoEasy
  6. postman+newman生成html报告
  7. 机器学习 —— 概率图模型(Homework: CRF Learning)
  8. bootstrap在iframe框架中实现由子页面在顶级页面打开模态框(modal)
  9. 不用GAN、VAE,谷歌发明视频生成的扩散模型,实现新SOTA
  10. 46 - 算法 -Leetcode 168 -位运算 类型模拟倒序利用vector
  11. 熟悉常规B/S、C/S系统开发实现原理
  12. 应对雾霾,哪款口罩适合你?
  13. 基于51单片机控制的BUCK开关电源Proteus仿真
  14. sed修炼系列(一):花拳绣腿之入门篇
  15. u 盘安装linux系统,CentOS 7 系统安装之 U 盘安装法
  16. 墙裂推荐 Anaconda | 安利 Python IDE
  17. Invalid Java package name: '1' is not a valid Java identifier eclipse创建sevlet时,无法创建
  18. 咸鱼前端—CSS盒子模型
  19. Mac电脑双击打不开文件夹
  20. 论文阅读笔记五十:CornerNet: Detecting Objects as Paired Keypoints(ECCV2018)

热门文章

  1. 软件测试常见面试题及答案
  2. 【Web前端学前体验】HTML+CSS 实战练习-Olay玉兰油官网
  3. sci写作之前的记录
  4. 恒太照明在北交所上市:募资规模缩水三成,第三季度收入下滑
  5. 跳过数据准备,下秒数据让飞书维格表数据应用更高效
  6. 揭个人信息黑产链条:含50多种交易大项 可私人定制
  7. Ubuntu18.04安装ROS最后的rosdep update不成功解决方案(亲测可行)
  8. BULK INSERT如何将大量数据高效地导入SQL Server
  9. 嵌入式linux技能,学IT技能 学嵌入式Linux必知内容
  10. 如何进入大数据领域,学习路线是什么?