用python批量查询表格中手机号的运营商及归属地!
今天以自己的亲身经历给大家分享一个python的实用技能。
前几天老板给安排了一个小活,让我把表格内的手机号归属地和运营商添加上去
我起初以为就几个手机号,没想到一打开发现有200多个,这要是一个一个查,我就不用下班了,为了节省实践,我决定用python解决这个问题。
一、情况分析
首先我找到一个手机号在线查询的网址:
https://tool.lu/mobile/
看起来还是比较方便的,只需输入手机号码,点击查询,就会返回归属地及运营商等信息。
用浏览器自带抓包工具分析了一下查询过程:
发现该过程以post请求实现,以手机号和1个固定值为参数,返回结果为json格式的数据,包含归属地及运营商等信息。
二、python实现
1.生成随机手机号码
为了保护隐私,我决定用python自动生成一批手机号来完成此次试验
首先,在晚上找了一批手机号码段:
将这些号码段以顿号相隔组成字符串,然后用split分割成列表,再用radom.choice从中随机取出1个,最后在随机生成8位数字,将两者加到一起就组成1个手机号了,生成30个随机手机号的代码如下:
nums_start='139、138、137、136、135、134、159、158、157、' \ '150、151、152、147、188、187、182、183、184、' \ '178、130、131、132、156、155、186、185、145、176、' \ '133、153、189、180、181、177、173'for i in range(30): L = random.randint(10000000, 99999999) nums_list=nums_start.split('、') phonenum=random.choice(nums_list)+str(L)
2.编写网络爬虫程序
根据第一步的分析过程,我们只需要依次将生成的手机号带入post请求的参数,然后再解析返回的json数据,将手机号、归属地及运营商等信息另存入1个表格就ok了,主要通过pandas函数实现。因为我发现pandas库操作表格真是太方便了,需要经常用到表格的朋友一定要好好学一学。
批量爬取手机号归属地及运营商的代码如下:
for i in range(30): L = random.randint(10000000, 99999999) nums_list=nums_start.split('、') phonenum=random.choice(nums_list)+str(L) data={ 'mobile':phonenum, 'operate':'query' } response=requests.get(url,headers=header,params=data) result=json.loads(response.text) provice=result['text']['province'] city=result['text']['city'] corp=result['text']['corp'] phones.append(phonenum) #手机号 areas.append(provice+city) #归属地 corps.append(corp)data={'手机号':phones,'归属地':areas,'运营商':corps}dataframe=pd.DataFrame(data)dataframe.to_excel('result1.xlsx', index=False)
最终效果如下:
小结:本次给大家带来的是python在职场应用的一角,用到的都是最基础的python知识,但是却能很便利的帮助我们解决工作中的大问题,希望大家在学习基础知识的过程中,也要注意多想实际工作中应用,既能帮我们巩固所需知识,又能提高对学习的积极性。
源码获取私信小编01
用python批量查询表格中手机号的运营商及归属地!相关推荐
- 基于python批量统计表格中的某一列去除异常值后的平均值
当我们需要对多个表格表格中的某一列进行统计时,且该列数据存在异常极端值,可通过百分位数的方法将极端值筛选掉,在本次案例将小于5%的分位数和大于95%分位数的数值去掉,统计的5%~95%内的数据的平均值 ...
- python调用everything批量查找表格中的文件名在磁盘中是否存在
python调用everything批量查找表格中的文件名在磁盘中是否存在 介绍 Everything 配置 使用openpyxl读写文件 读文件 写文件 BeautifulSoup的使用 创建 be ...
- python 批量查询网页导出结果_python批量查询网页的HTTP状态码
最近业余时间在改版一个网站,改版之前频繁调整了一些栏目的属性,包括栏目的层级,这种最怕就是调整了栏目的从属关系,导致了栏目的URL地址改变,一旦改版就导致整个栏目及其下面的文章页地址变更,成为死链.而 ...
- python 查找excel表格中重复的信息并标出来
Python之PyMuPDF--批量处理一个PDF文件中发票的总金额提取 python 查找excel表格中重复的信息并标出来 python 提取excel表格中指定的关键字 python 批量修改文 ...
- excel删除无尽空白行_Excel2019如何批量删除表格中的空白行?
在使用Excel2019编辑文档的时候,在表格中有很多的空白行如何批量的把这些空白行给删除掉呢 Excel2019如何批量删除表格中的空白行? 首先在电脑上用Excel2019打开要编辑的表格,可以看 ...
- 如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件?
如何利用python将excel表格中筛选出来的每一份数据各自另存为新的excel文件? 1.问题描述 2.解决过程 2.1 问题分析: 2.2 解决思路 3.运行结果 1.问题描述 最近在处理一堆工 ...
- python批量查询豆瓣书籍评分(教程附源码)
在懒人盘分享的高分电子书是利用python批量查询得到的 发现常规的豆瓣api不允许调用了,几番搜索发现一个接口 https://book.douban.com/j/subject_suggest?q ...
- 【Python数据分析】利用Python删除EXCEL表格中指定的列数据或行数据
如何利用Python删除EXCEL表格中指定的列数据?今天与大家一起分享一下DataFrame对象的drop()函数,drop()函数可根据标签删除EXCEL表格中的列数据或行数据,其语法格式如下: ...
- python批量将CAD中的每个图分别转化为对应的PDF(cad转pdf)
python批量将CAD中的每个图分别转化为对应的PDF(cad转pdf) 需要在cad上选择左下角和右小角的坐标,会有提示,注意看即可 通过交互方式将一个CAD中的每个图纸分别转为一个pdf,简单易 ...
最新文章
- 【经典概念】一文详解Batch Normalization!!!
- python自定义函数详解_python基础教程之自定义函数介绍
- Science nature合集 2021年度上半年
- java socket 判断Socket连接失效
- Hibernate上路_16-继承关系映射
- java高级考试题_JAVA高级考试题
- 虚幻4引擎开发的手游_掌上视觉进化,盘点近年虚幻4引擎开发的手游大作
- linux下gzip用法,Linux gzip 命令的使用
- 魏巍专访丨合作半年拓客100+,他是如何做到的?
- virt-manage 使用
- 20 C++ 秒数转换时分秒
- 机器学习的前世今生:一段波澜壮阔的历史
- 使用虚拟信用卡在Poshmark下单教程和注意事项
- 计算机师徒结对方案,师徒结对计划
- JS 大杂烩(持续更新)
- 什么是等保?为什么做等保?如何做等保?
- Docker容器日常操作命令
- 输入证件号码,生日自动回填
- centos 配置IP ens33
- centos下cx_oraclel连接报错dpi1047错误唯一正解
热门文章
- 上网必备 11款流氓软件清除工具推荐
- java 获取mp3 封面_java如何获取.mp3格式文件内置歌曲封面
- c语言坐标海伦公式,C语言:用海伦公式求三角形面积 , C语言编程问题,利用海伦公式求三角形面积...
- 高质量伪原创怎么做(文章做伪原创的方法有哪些)
- 如何利用消息系统避免分布式事务
- DevOps是MindSet:工具也好,文化也罢,人员才是关键
- viso画图神器VS CONDE插件PlantUML
- 最全BAT大型互联网公司面试题整理,没有之一
- 21cn企业邮箱服务器端口号,我怎么样才能知道自己邮箱的端口号?
- 基于matlab桁架分析,基于MATLAB平面桁架有限元分析研究