法律没有对爬虫行为有司法解释,从已有判决案例来看主要是看你数据用途/是否有商业竞争/商业侵权/扰乱破坏对方软件正常经营,而且必须是对方有证据来举证你。

现在已有案例对爬虫的判决依据是《刑法》第285条,非法获取计算机信息系统罪;第286条,破坏计算机信息系统罪;《网络安全法》倒卖隐私数据,如果你抓取隐私数据进行倒卖的话;等几条。

先定义一下爬虫行为,爬虫技术不只是用来抓取网络数据,爬虫技术本质上是模拟网络请求。所以广义的爬虫技术可以用来做:抓取网页/APP数据,刷票/耍点击,抢票(火车票,医院挂号等),自动加好友等等事情。

下面来看看已有司法判决的几个典型案例:

1.今日头条离职员工抓取今日头条视频

从判决文书网上描述来看,修改UA,device_id等行为,我想大部分爬虫程序员都会干这个。但是被告是今日头条的离职员工,这就比较敏感,上海晟品也在做视频业务,这就涉及直接商业竞争。

2.脉脉非法使用微博用户信息

脉脉抓取微博用户头像等账户信息,显示在脉脉APP里面,这是不正当竞争,直接使用别人产品数据风险很大。

3.扰乱正常经营

写爬虫抢票,刷量,抢号,而且用于商业牟利,这是通过软件扰乱别人正常经营。

4.商业竞争

“车来了”抓取“酷米客”的公交信息展示在自己的产品上,这两家都是提供公交数据查询,是直接商业竞争关系。

从上面的案例能够看出,爬虫被举证违法主要还是看你抓取数据后的运用。

1.抓取竞品数据,运用商业目的,风险大;

2.抓取拥有知识产权/版权数据,运用商业目的,风险大;

3.爬虫扰乱软件/产品的正常经营,运用商业目的,风险大;

所以,如果你是公司员工,要关注下抓取数据后的运用,通常数据直接被运用的风险较大,负责抓取的技术人员和公司负责人都要进去。

另外要注意看被抓产品的知识产权申明,可以看我写的这篇:

爬虫有风险,开爬需谨慎。

python开源爬虫项目违法吗_爬虫究竟是合法还是违法的?相关推荐

  1. 爬虫究竟是合法还是违法的?

    据说互联网上 50%以上的流量都是爬虫创造的,也许你看到很多热门数据都是爬虫所创造的,所以可以说无爬虫就无互联网的繁荣. 前天写了一篇文章< 只因写了一段爬虫,公司200多人被抓!>,讲述 ...

  2. python import request 不报错_爬虫学习路径整理及安装环境遇到的坑

    学习路径是我自己提炼和精选的,只适合我个人,因为虽然有技术基础但是我刚入门爬虫视野很窄不专业,为避免误导你们,你们最好参考知乎上大牛已经回答的好答案.我发这篇文章,目的是给自己看的.ps,专栏下每篇文 ...

  3. python爬虫实时更新数据_爬虫的增量式抓取和数据更新

    一些想法 页面爬的多了,量上去了之后,就会遇到其他的问题,其实不管做什么技术量大了都会有问题.一般情况下,我认为解决"大量"问题的思路有两个:一种是着力于优化系统的能力,让原本只能 ...

  4. [转载] python开源人工智能项目_推荐 10 个饱受好评且功能独特的开源人工智能项目

    参考链接: 关于Python的10个有趣事实 摘要: 十个有趣的开源人工智能项目,千万不要错过了~~ 关于人工智能的项目,相信大家都看过或者用过不少了,但它们的大多数看上去都十分"高大上&q ...

  5. python爬虫爬取豆瓣_爬虫,从爬取豆瓣开始

    1 爬虫概述 当初第一次接触python,听的最多的就是爬虫爬虫,搞得我一脸蒙蔽,因为我从来都没听过这么新颖的词,而且我还天真的以为是不是python长得像一条小虫子,所以才叫爬虫. 直到后来经过不断 ...

  6. python开源web项目-最火的五大 python 开源项目

    原标题:最火的五大 python 开源项目 python 语言易学,且开发高效,用 python 语言开发的开源项目活跃度很高,下面介绍目前最活跃的五大 python 开源项目: 1.) 排名第一位的 ...

  7. python开源web项目-30 个惊艳的Python开源项目

    在过去的一年里,Mybridge AI 比较了近15000个开源Python项目,选择了前30名(概率只有0.2%). 这是一个竞争异常激烈的名单,精挑细选了2017年1月到12月之间发布的最佳开源P ...

  8. 爬虫爬评书吧_爬虫 + 小程序 自定义开发一个听书程序

    最近工作之余会听听评书,但主流门户收费加广告着实让人烦躁.作为IT人,怎能如此顺应别人家的产品规则. 下面以 python + taro 为例,写一个爬虫 + 小程序的播放应用: 最终实现的效果如下: ...

  9. 反爬虫兵法演绎04 _ 爬虫的首轮攻势:如何低调地拿到自己想要的数据?

    本资源由 Java学习者论坛 收集整理 04 | 爬虫的首轮攻势:如何低调地拿到自己想要的数据? 你好啊,我是DS Hunter.又见面了. 前面我和你聊了聊爬虫和反爬虫的历史,感觉这是一个内卷的死结 ...

最新文章

  1. ubuntu14.04上安装python3.6
  2. 医学影像AI:全球市场展望
  3. 基于Javaweb实现企业财务管理系统
  4. Node.js Stream(流) 简单易懂全解析
  5. android 日历按周获取,Android日历获取当前周,前几周和下周
  6. Angular HTML template的解析位置
  7. 编码文件AndroidStudio初体验:解决Execution failed for task ':TestAndroid:compileDebug'.
  8. java jdbc事务_Java JDBC事务管理和保存点
  9. Java千百问_05面向对象(008)_java中覆盖是什么
  10. 文件描述符表,打开文件表,索引节点表
  11. 从小说网站爬取小说并写入txt文档中
  12. 2018研究生毕业论文重复率检测八要点
  13. Jupyter Notebook设置密码且遇到提示:ImportError: DLL load failed while importing _ssl
  14. greenplum 历史拉链表
  15. 问号在c语言里面的作用,问号的作用是什么-写作基础知识
  16. 品优购项目案例(练习)
  17. 【数据结构】顺序表(增、删、查、改)的实现 [初阶篇_ 复习专用]
  18. Bullet physics 引擎的官方文档翻译
  19. linux ioctl 设备只读,linux – lsattr:设备的不适当的ioctl在读取标志时
  20. ATM机跨行取款也有理财窍门

热门文章

  1. 电话机怎么注册到服务器上,技术|将 VoIP 电话直接连接到 Asterisk 服务器
  2. 【软件测试03】APP测试理论集合
  3. 中国5G 700M频谱情况。
  4. [iOS]UIButton+Badge
  5. LeetCode(72)Edit Distance
  6. win下使用fvm实现多个Flutter版本的切换
  7. 施努卡:机器视觉识别用到的方法(机器人视觉识别)
  8. 使用potplayer录制屏幕
  9. 《树莓派》开发 之 用 0.96OLED 播放 badapple 视频
  10. Unknown layer:Functional