python开源爬虫项目违法吗_爬虫究竟是合法还是违法的?
法律没有对爬虫行为有司法解释,从已有判决案例来看主要是看你数据用途/是否有商业竞争/商业侵权/扰乱破坏对方软件正常经营,而且必须是对方有证据来举证你。
现在已有案例对爬虫的判决依据是《刑法》第285条,非法获取计算机信息系统罪;第286条,破坏计算机信息系统罪;《网络安全法》倒卖隐私数据,如果你抓取隐私数据进行倒卖的话;等几条。
先定义一下爬虫行为,爬虫技术不只是用来抓取网络数据,爬虫技术本质上是模拟网络请求。所以广义的爬虫技术可以用来做:抓取网页/APP数据,刷票/耍点击,抢票(火车票,医院挂号等),自动加好友等等事情。
下面来看看已有司法判决的几个典型案例:
1.今日头条离职员工抓取今日头条视频
从判决文书网上描述来看,修改UA,device_id等行为,我想大部分爬虫程序员都会干这个。但是被告是今日头条的离职员工,这就比较敏感,上海晟品也在做视频业务,这就涉及直接商业竞争。
2.脉脉非法使用微博用户信息
脉脉抓取微博用户头像等账户信息,显示在脉脉APP里面,这是不正当竞争,直接使用别人产品数据风险很大。
3.扰乱正常经营
写爬虫抢票,刷量,抢号,而且用于商业牟利,这是通过软件扰乱别人正常经营。
4.商业竞争
“车来了”抓取“酷米客”的公交信息展示在自己的产品上,这两家都是提供公交数据查询,是直接商业竞争关系。
从上面的案例能够看出,爬虫被举证违法主要还是看你抓取数据后的运用。
1.抓取竞品数据,运用商业目的,风险大;
2.抓取拥有知识产权/版权数据,运用商业目的,风险大;
3.爬虫扰乱软件/产品的正常经营,运用商业目的,风险大;
所以,如果你是公司员工,要关注下抓取数据后的运用,通常数据直接被运用的风险较大,负责抓取的技术人员和公司负责人都要进去。
另外要注意看被抓产品的知识产权申明,可以看我写的这篇:
爬虫有风险,开爬需谨慎。
python开源爬虫项目违法吗_爬虫究竟是合法还是违法的?相关推荐
- 爬虫究竟是合法还是违法的?
据说互联网上 50%以上的流量都是爬虫创造的,也许你看到很多热门数据都是爬虫所创造的,所以可以说无爬虫就无互联网的繁荣. 前天写了一篇文章< 只因写了一段爬虫,公司200多人被抓!>,讲述 ...
- python import request 不报错_爬虫学习路径整理及安装环境遇到的坑
学习路径是我自己提炼和精选的,只适合我个人,因为虽然有技术基础但是我刚入门爬虫视野很窄不专业,为避免误导你们,你们最好参考知乎上大牛已经回答的好答案.我发这篇文章,目的是给自己看的.ps,专栏下每篇文 ...
- python爬虫实时更新数据_爬虫的增量式抓取和数据更新
一些想法 页面爬的多了,量上去了之后,就会遇到其他的问题,其实不管做什么技术量大了都会有问题.一般情况下,我认为解决"大量"问题的思路有两个:一种是着力于优化系统的能力,让原本只能 ...
- [转载] python开源人工智能项目_推荐 10 个饱受好评且功能独特的开源人工智能项目
参考链接: 关于Python的10个有趣事实 摘要: 十个有趣的开源人工智能项目,千万不要错过了~~ 关于人工智能的项目,相信大家都看过或者用过不少了,但它们的大多数看上去都十分"高大上&q ...
- python爬虫爬取豆瓣_爬虫,从爬取豆瓣开始
1 爬虫概述 当初第一次接触python,听的最多的就是爬虫爬虫,搞得我一脸蒙蔽,因为我从来都没听过这么新颖的词,而且我还天真的以为是不是python长得像一条小虫子,所以才叫爬虫. 直到后来经过不断 ...
- python开源web项目-最火的五大 python 开源项目
原标题:最火的五大 python 开源项目 python 语言易学,且开发高效,用 python 语言开发的开源项目活跃度很高,下面介绍目前最活跃的五大 python 开源项目: 1.) 排名第一位的 ...
- python开源web项目-30 个惊艳的Python开源项目
在过去的一年里,Mybridge AI 比较了近15000个开源Python项目,选择了前30名(概率只有0.2%). 这是一个竞争异常激烈的名单,精挑细选了2017年1月到12月之间发布的最佳开源P ...
- 爬虫爬评书吧_爬虫 + 小程序 自定义开发一个听书程序
最近工作之余会听听评书,但主流门户收费加广告着实让人烦躁.作为IT人,怎能如此顺应别人家的产品规则. 下面以 python + taro 为例,写一个爬虫 + 小程序的播放应用: 最终实现的效果如下: ...
- 反爬虫兵法演绎04 _ 爬虫的首轮攻势:如何低调地拿到自己想要的数据?
本资源由 Java学习者论坛 收集整理 04 | 爬虫的首轮攻势:如何低调地拿到自己想要的数据? 你好啊,我是DS Hunter.又见面了. 前面我和你聊了聊爬虫和反爬虫的历史,感觉这是一个内卷的死结 ...
最新文章
- ubuntu14.04上安装python3.6
- 医学影像AI:全球市场展望
- 基于Javaweb实现企业财务管理系统
- Node.js Stream(流) 简单易懂全解析
- android 日历按周获取,Android日历获取当前周,前几周和下周
- Angular HTML template的解析位置
- 编码文件AndroidStudio初体验:解决Execution failed for task ':TestAndroid:compileDebug'.
- java jdbc事务_Java JDBC事务管理和保存点
- Java千百问_05面向对象(008)_java中覆盖是什么
- 文件描述符表,打开文件表,索引节点表
- 从小说网站爬取小说并写入txt文档中
- 2018研究生毕业论文重复率检测八要点
- Jupyter Notebook设置密码且遇到提示:ImportError: DLL load failed while importing _ssl
- greenplum 历史拉链表
- 问号在c语言里面的作用,问号的作用是什么-写作基础知识
- 品优购项目案例(练习)
- 【数据结构】顺序表(增、删、查、改)的实现 [初阶篇_ 复习专用]
- Bullet physics 引擎的官方文档翻译
- linux ioctl 设备只读,linux – lsattr:设备的不适当的ioctl在读取标志时
- ATM机跨行取款也有理财窍门