360软件管家怎么下载python_python 爬虫爬取360安全卫士对某一个号码的标识
手机客户端通常会安装了一些类似360安全卫士,手机安全卫士等等诸如此类的软件,这些软件可以标识过滤一些电话号码是诈骗电话、骚扰电话或广告推销............
由于公司是线商业务,很多号码配置给客户作为电话销售使用从而被标识为各种性质的标记,需要把一些不利于被人接受的号码过滤掉。考虑到号码众多,一个个查看显然工作量大,时效低。从而考虑到用python爬虫收集数据
实例:
#!/usr/bin/env python
#coding:utf-8
#author : soul
import sys
reload(sys)
import requests
import urllib,urllib2
from bs4 import BeautifulSoup
sys.setdefaultencoding('utf-8')
f = open("/home/py/test1.txt","rw+") #打开test1.txt号码数据表
w = open("/home/py/result.txt","rw+") #打开一个空文本,用于写入结果值。
a = f.readlines() #一行行读取test1.txt数据表
abc = '诈骗电话'
for h in a:
i = h.strip()
url = 'https://www.so.com/s?q=%s' % i #url 为https://www.so.com/s?q=02081452010 将号码赋值给i
page = urllib2.urlopen(url)
number = i
soup = BeautifulSoup(page)
for e in soup.findAll('span',{'style':'background-color:#e76639'}):
result1 = e.get_text().split("|")
for term1 in result1:
xingzhi = term1
for f in soup.findAll('b'):
result2 = f.get_text().split("|")
for term2 in result2:
biaoshi = term2
if xingzhi == abc:
print '\033[33mThe number %s marked as %s about %s\033[0m' % (number,xingzhi,biaoshi)
result = '%s %s %s' % (number,xingzhi,biaoshi)
w.writelines(result + "\n") #用writelines 将结果写入result.txt
xingzhi = '未收录' #初始化 将xingzhi 设置为未收录 标识为0
biaoshi = 0
test1.txt
结果:
360软件管家怎么下载python_python 爬虫爬取360安全卫士对某一个号码的标识相关推荐
- 软件管理的工具-360软件管家提供下载
360软件管家是360安全卫士中的一个软件管理的工具.360软件管家中包括软件大全.软件下载.软件升级.软件卸载.软件体验.游戏中心.应用宝库等功能.360软件管家还有贴心的开机加速管理为你提供专业建 ...
- 爬一个人的所有微博 python_Python爬虫--爬取微博指定用户主页下的所有图片
Python爬虫--爬取微博指定用户主页下的所有图片 写在前面 最近比较无聊,冒出来一个想法,去各大图片网站爬取大妹子的图片,然后自己写个简单的网站,按网站分类显示图片,第一个想到的是爬取知乎问题下面 ...
- 360软件管家怎么下载python_再见,360安全卫士
今日推文速看 二条:神仙APP!彻底逼死付费软件! 三条:用Python分析北京市蛋壳公寓租房数据 四条:8个高效Python数据分析的技巧(附完整代码)? 五条:联手腾讯云给Python新手推荐的入 ...
- 360软件管家怎么下载python_【pyLoad官方版】pyLoad(开源下载管理器) v0.4.20 官方版-开心电玩...
软件介绍 pyLoad官方版是一款采用纯Python编写的网络下载工具,这款软件不仅可以帮助用户轻松下载各种资源,视频.音乐.游戏.程序都可以搞定.而且我们还可以享受到网络顶级速度,快速完成下载工作. ...
- 360软件管家怎么下载python_用Python自动清理系统垃圾,再也不用360安全卫士了
用Python自动清理系统垃圾,再也不用360安全卫士了 在Windows在安装和使用过程中都会产生相当多的垃圾文件,包括临时文件(如:.tmp.._mp)日志文件(.log).临时帮助文件(.gid ...
- 360软件管家怎么下载python_再见,360安全卫士
在Windows在安装和使用过程中都会产生相当多的垃圾文件,包括临时文件(如:.tmp.._mp)日志文件(.log).临时帮助文件(.gid).磁盘检查文件(.chk).临时备份文件(如:.old. ...
- python爬虫 爬取360图片(非结构化数据)
爬虫思路:先拼接json数据包的url,再从中提取图片链接 域名:image.so.com 抓包 360图片是动态加载的数据 点击图片分类中的清新美女 --> ctrl + shift + i ...
- 360软件管家下载|360软件管家电脑版下载
360软件管家是一款我简单很好的软件软件中[商城]频道,集"视频直播"."社区交友"."音乐阅读"."游戏"等多种商品于 ...
- Java爬虫 爬取某招聘网站招聘信息
Java爬虫 爬取某招聘网站招聘信息 一.系统介绍 二.功能展示 1.需求爬取的网站内容 2.实现流程 2.1数据采集 2.2页面解析 2.3数据存储 三.获取源码 一.系统介绍 系统主要功能:本项目 ...
最新文章
- Python 标准库之 Queue
- 了解PowerShell命令——PowerShell三分钟(二)
- SDNU 1469.校门外的树(水题)
- rgba的兼容性 IE
- 网络编程之-----------进程
- eclipse.ini配置eclipse的启动参数
- mysql group by having 子句
- 解决办法:fatal error: SDL.h: 没有那个文件或目录
- php 判断是否在线,关于判断用户是否在线的问题!!!
- 用c语言判断字符串为空,如何检查C字符串是否为空
- c语言utc时间转换,gps时转换为utc时间方法
- 省花博会,或将成为跳马百亿产业的跳板
- JMeter-Ramp-up Period解释
- js点击第三方广告添加点击事件
- 如何在家免费使用知网?
- 等比数列求和python_Python科学计算
- iOS 开源图形库 Core Plot 使用教程
- 4.1 js小练习题javascript 今日小练习
- 【云原生 | Kubernetes 系列】--Envoy熔断
- Java IOS客户端上传多张图片到服务端
热门文章
- JAVA抖音潜艇挑战_抖音潜水艇挑战怎么玩 抖音潜水艇挑战玩法和潜艇王者称号获得方法...
- 修改linux终端命令行颜色+PS1设置
- 为什么要使用代理模式
- 微信小程序 + vant组件van-card 图片解析不到
- 2_10_190518
- 计量经济学复习笔记(一):一元线性回归(上)
- 复杂网络(2)--图论的基本理论-最小生成树问题
- 小提琴和钢琴一起学行吗_小朋友有没有办法,同时学好钢琴和小提琴?
- SRTM、ASTER GDEM等全球数字高程数据(DEM)下载方式简介
- (2)扩散模型 Diffusion Model 1-2 扩散阶段