作者简介

蓝桥签约作者、大数据&Python领域优质创作者。维护多个大数据技术群,帮助大学生就业和初级程序员解决工作难题。

我的使命与愿景:持续稳定输出,赋能中国技术社区蓬勃发展!

最近的IT公司违法案件越来越多,看了很多因为爬虫,数字货币,博彩网站外包等被抓的事情,给大家提个醒,打工注意不能违法,写代码背后也有法律风险。

一、什么是爬虫?

通过爬虫代码,下载互联网上的数据到本地,并且提取出我们需要的信息的过程。

二、典型违法案例

典型案例(一):构成非法获取计算机信息系统数据罪

张某等非法获取计算机信息系统数据案(上海市杨浦区人民法院(2015)杨刑初字第232号)

本案中,同享公司人员因通过技术手段非法获取掌门公司服务器存储的大量WIFI热点密码数据,被判非法获取计算机信息系统数据罪。

典型案例(二):构成非法侵入计算机信息系统罪

鲁某、吴某非法侵入计算机信息系统案(眉山市东坡区人民法院(2018)川1402刑初56号)

鲁某和吴某因获取国家事务网站数据信息,最终被判非法侵入计算机信息系统罪。

该案中,鲁某为获取投标数据,雇佣、指使吴某利用黑客技术取得眉山市公共资源电子交易网站的最高权限,吴某在该服务器上非法获取相关投标信息后发送给鲁某。

与本案相关的法律法规为:

《刑法》

第二百八十五条第一款主要内容:违反国家规定,侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,处三年以下有期徒刑或者拘役。

典型案例(三):构成提供侵入、非法控制计算机信息系统的程序、工具罪

王甲、王乙提供侵入、非法控制计算机信息系统程序、工具案(南城县人民法院(2018)赣1021刑初13号)

本案中,王甲和王乙制作并销售用于攻击58同城网页漏洞并采集公民个人简历信息的软件,最终被判提供侵入、非法控制计算机信息系统的程序、工具罪。

该案中,王甲利用计算机编程先后制作了“ANYR”、“蓝鲸”、“宝马”三个软件,专门用于攻击58同城网页漏洞并采集网站上公民个人简历信息。王甲和王乙两人分工合作,由王甲负责软件的运营和维护,由王乙负责软件的推广与销售,并约定分成。本案中,王甲和王乙通过销售前述软件获利5000元以上。

与本案相关的法律法规的主要内容为:

《刑法》

第二百八十五条第三款主要内容:提供专门用于侵入、非法控制计算机信息系统的程序、工具,或者明知他人实施侵入、非法控制计算机信息系统的违法犯罪行为而为其提供程序、工具,情节严重的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。

三、什么样的爬虫是合法的?

1、 遵守 Robots 协议

Robots 协议也叫 robots.txt(统一小写)是一种存放于网站根目录下的 ASCII 编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。

Robots 协议就是告诉爬虫,哪些信息是可以爬取,哪些信息不能被爬取,严格按照 Robots 协议 爬取网站相关信息一般不会出现太大问题。

2、不能造成对方服务器瘫痪

但不是说只要遵守 Robots 协议的爬虫就没有问题,还涉及到两个因素,第一不能大规模爬虫导致对方服务器瘫痪,这等于网络攻击。

2019年05月28日国家网信办发布的《数据安全管理办法(征求意见稿)》中,拟通过行政法规的形式,对爬虫的使用进行限制:

网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。

3、不能非法获利

恶意利用爬虫技术抓取数据,攫取不正当竞争的优势,甚至是牟取不法利益的,则可能触犯法律。实践中,非法使用爬虫技术抓取数据而产生的纠纷其实数量并不少,大多是以不正当竞争为由提请诉讼。

举个例子,如果你把大众点评上的所有公开信息都抓取了下来,自己复制了一个一模一样的网站,并且还通过这个网站获取了大量的利润,这样也是有问题的。

一般情况下,爬虫都是为了企业获利的,因此需要爬虫开发者的道德自持和企业经营者的良知才是避免触碰法律底线的根本所在。

四、我们该怎么做

对程序员而言,首先要提高职业警惕性。程序员在当今的大数据时代,其杀伤力不亚于手里握着钢枪的战士,因此,自然应该对手中的程序的合法合规与否格外警惕:

(1) 明确自己制作的爬虫程序是否涉及抓取对象的个人信息,如社交信息、财产信息、联系信息等;

(2) 明确是否涉及被抓取对象的商业机密,再次明确被抓取对方是否是自己所任职公司的直接竞争对手;

(3) 严格按照公司制定的软件开发规范做事。

如果主管或者老板要求在开发规范之外,给爬虫程序加装“外挂”,如伪装外挂、暴力破解外挂时,硬气一点的,可以直接递上一本《中华人民共和国刑法》,而迫于生活压力不敢正面硬刚的,也要注意留下开发指令的书面邮件记录。诚然,生活不易,但为了微薄的工资而身陷囹吾,则是得不偿失了。

【求评论、求点赞、求收藏】 

《爬虫写得好,铁窗关到老》教你把握爬虫的法律边界!㊫相关推荐

  1. 我学习 Java 的历程和体会(写给新手看,欢迎老司机批评和建议,持续更新中)

    我学习 Java 的历程和体会(写给新手看,欢迎老司机批评和建议,持续更新中) 最初写这篇文章的时候,是在今年的 9 月中旬.今天,我想再写写这将近两个多月以来的感受. 在今年的 10 月我来到北京求 ...

  2. 自己帮别人写的网站可以公开源码吗_专注爬虫:20个精心总结爬虫项目,爬虫技术这里强(附源码)...

    写在前面 你想成为Python爬虫的高手么?你想爬取你想要的高质量数据么? 那么你得需要进行爬虫项目的演练,那样你才有可能在Python爬虫的道路上走的更远 小编在这里精心总结了20个爬虫项目的演练, ...

  3. 飞鸽传书已经写了5年,还是老样子。

    妈妈回来了的飞鸽传书,飞鸽传书已经写了5年,还是老样子.妈妈回来了,晚上,等会儿想什么就做什么,我们的孩子懂事了,她不知道是谁做的,好了没有,就问是哪个小仙女做的,把皇宫变成金子做的吧,而且和要经常帮 ...

  4. 程序写不好,总理当到老!

    导读:自古英雄出少年,可惜不想当总理,只想当个程序员. 最近HackNext网站有一个贴子引发网友热议,一位叫Lihaoyi的作者宣布自己刚刚写了一本叫<动手Scala编程>的书,表示自己 ...

  5. python使用爬虫写一个自己的翻译器(带图像界面)

    python使用爬虫写一个自己的翻译器(带图像界面)   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客,B站昵称为 ...

  6. 爬虫写得好,牢饭吃到饱?

    先说一条新闻,一家专注大数据的数据服务提供商公司巧达科技,因为大量使用爬虫访问其他公司接口获取数据,整个公司被抓,最后不光管理者,干活的程序员也被抓了. 很多学python的同学都接触过爬虫,即便是没 ...

  7. 爬虫写得好,牢饭吃得早

    爬虫在互联网时代并不稀奇,面对海量数据,人工获取信息的效率低.时效性差,为了提升体验很多公司都会开发爬虫系统.但是,爬虫写得好,牢饭吃得早. 来自 2018 年的公开案例: 某公司 2017 年转型做 ...

  8. 用爬虫写一个,小说下载程序

    用爬虫写一个,小说下载程序 环境:python 3.7.3 没啥难度和技术含量,随便写写.本来程序有部分可用format进行优化,但又想了想小说名可能还会 有一些奇奇怪怪的符号,就没弄了. impor ...

  9. 如何写一只抓哔哩哔哩弹幕的爬虫

    原文地址:http://blog.csdn.net/bigbigsman/article/details/78639053 如何写一只抓哔哩哔哩弹幕的爬虫 爬虫工作流程 解析首页获得视频cid 构造所 ...

最新文章

  1. 如何下载flash离线安装包
  2. php json转数组后并在前端展示,0516-如何从服务器端获取JSON格式字符串并解决到前端页面中显示...
  3. awk 实例练习 (三)
  4. [PAT乙级]1023 组个最小数
  5. python运行是哪个键_python – 如何使用回车键调用按钮命令
  6. js 判断图片是否加载完成
  7. 基于JAVA+Spring+MYSQL的婚纱摄影网站
  8. MyCat双机HA高可用集群搭建_HAProxy安装和配置---MyCat分布式数据库集群架构工作笔记0028
  9. php eval 安全性,php – 使用eval解析表单输入的方程式的最安全的方法
  10. 阿里云MaxCompute中pyODPS的使用:多线程上传、下载、分区
  11. java股票公式源码_通达信公式转java
  12. 一个商品SKU是怎么生成的
  13. ADNI数据集相关概念初步整理
  14. 微步在线安全事件分析:全球数亿主机被FireBall攻陷
  15. 手机号码测凶吉附带手机号码归属地C#版
  16. java生成唯一的五位字符串_java唯一字符串ID生成方案详解
  17. (小脚本) (python) 批量修改文件后缀名
  18. 【javaEE】网络编程套接字
  19. 搜索不到投屏设备怎么办_电视投屏搜索不到设备解决方案
  20. 刘永富的Office开发资源-告别vba.mahoupao.net-移居博客园

热门文章

  1. 改变世界,改善生活:我从科沃斯扫地机器人X1,看到了AI新的希望
  2. 谷歌大改Transformer注意力,速度大涨,显存大降!
  3. All in Linux:一个算法工程师的IDE断奶之路
  4. 你的模型真的陷入局部最优点了吗?
  5. 玩转算法之面试第十章-贪心算法
  6. MD5,MD2,SHA加密的实现方式
  7. 论文笔记(eTrust: Understanding Trust Evolution in an Online World)
  8. CRISP-DM:数据挖掘标准流程
  9. 卷积神经网络结构优化综述
  10. 个人项目:wc程序(java)