python爬虫网站接口的使用

  • 网站任何输入的对话框,都对应着相关的接口
  • 找到接口对应的关键字,就可以使用爬虫输入关键字进行操作了
通过ip38网站实现爬虫查询ip归属地
  • 登陆相关的网址,随便查询一个项目,通过网址变化,获取对应接口的关键字
  • 如上图,就是获取相关的ip38网站的查询ip归属地的接口关键字
  • 将关键字包含关键字的网址全部复制,作为url来使用

代码如下

def getIPpalce(value):url = "https://www.ip38.com/ip.php?ip="r = requests.get(url,params=value)r.raise_for_status()return r.text[1500:]

通过爬虫实现输入字搜索
  • 自己打开对应的网站,随便输入关键词,从返回的网址就可直接看出
  • 如搜狗的,就是query :关键字
  • 百度的,就是 wd:关键字
  • bling的,就是q :关键字

在request库中的get函数中的url参数中,根据搜索引擎的关键字接口,添加关键字

  • 调用requests库的get函数
  • requests.get(url,params = None,**kwargs)
    • url:拟获取的页面的url连接
    • params:url中的额外的参数,将字典或者是字节流的格式,按照对应的方式加到url后部
  • kwargs控制访问参数

代码:

    kv = {'wd':'关键字'}r = requests.get("https://www.baidu.com/",params=kv)print(r.status_code)

  • 注意会将中文转换成别的字符码,不会直接显示中文
分析与总结
  • 任何的网站上要求输入的对话框,都会反映在网址变化中。在网址上,早多对应的接口关键字,就可以在网址中直接输入对应的关键字

    • 如,百度要求你输入关键字搜索的时候,在网址上的变化是出现wd + 关键字
    • 再如:上面举的关于确定ip地址的例子,在网址上加上对应的搜索关键字。

python爬虫网站接口的使用——将网页上的输入内容的接口转移到对应的爬虫中(通过爬虫查询相关网页的信息)相关推荐

  1. python 下载网页文件_『如何用python把网页上的文本内容保存下来』python爬取网页内容教程...

    python爬虫:如何爬网页数据并将其放在文本 用requests库 r=r.requests.get(url) r.concent 保存到文件里就行了 如何用python把网页上的文本内容保存下来 ...

  2. java复制屏幕文本内容_网页上的文字内容不给复制?电脑老司机教你输入一串代码,轻松复制...

    原标题:网页上的文字内容不给复制?电脑老司机教你输入一串代码,轻松复制 我们有时候需要一些资料就会去网上查资料,有的时候我们需要把这些资料的文字给复制下来.但并不是所有的资料都能直接复制的,不是登陆账 ...

  3. JavaScript中ajax如何不刷新,JavaScript基于Ajax实现不刷新在网页上动态显示文件内容...

    本文实例讲述了JavaScript基于Ajax实现不刷新在网页上动态显示文件内容的方法.分享给大家供大家参考.具体如下: 下面的JS代码是一个最基础的JS的ajax实现,可以动态显示服务器上的文件aj ...

  4. 无法在C语言软件里敲字,网页上不能输入文字怎么办

    今天有网友向我们来信反映说电脑开机后,打开浏览器发现自己网页上不能输入文字怎么办.换了几个浏览器还是一样的情况,查不出病毒和插件.下面一起来看看电脑工程师是怎么解决吧! 网页上无法输入字解决方法:( ...

  5. 网页上编辑的内容因为网页误关被删了,怎么恢复

    情况说明 情况说明 你是否有过如下经历: 花了2个多小时在一个没有保存键的网页上编写了一大堆文字,然后中途使用其他应用时,不小心关闭你的chrome浏览器? 这是你匆忙打开了你的历史记录,然后想要恢复 ...

  6. 如何复制网页上的任何内容(比如百度文库)

    目的 许多网页都不允许复制,只有进行开通VIP,注册用户,使用专业工具等才能完成ctrl+c和ctrl+v等简单操作.本文提供了一种比较简(cu)单(bao)的解决方案. 注意! 这篇文章话很直(bi ...

  7. 小妙招,在禁止复制粘贴的网页上复制粘贴内容

    小妙招,在禁止复制的网页上复制内容 有些时候,有些网页,是吧你懂的,想复制或者粘贴东西都不让复制粘贴.虽然有一些现有的插件啥的下载了能够解决,但是不同的网页如果都要下载插件岂不是有点麻烦. 教程 先f ...

  8. 【python】python获取网站源码失败,出现一堆script脚本内容

    问题原因 网站开启了防爬虫,爬取的设置,通过头部的cookie和User-Agent判断 解决流程 在头部设置以下内容 def ask_url(url,method):proxies = {" ...

  9. 去掉CSDN博客网页上多余的内容并保存为pdf

    从这里来的:https://blog.csdn.net/while_black/article/details/90201958 还有这:https://www.jerrycoding.com/art ...

最新文章

  1. itextpdf中文不显示_LaTeX实时预览中文
  2. Python中使用requests和parsel爬取喜马拉雅电台音频
  3. 《操作系统》实验报告——主存空间的分配与回收
  4. vue rem适配_vue如何使用UI库快速开发项目
  5. Android 开发笔记___Activity的生命周期
  6. phpmyadmin mysql float 长度_mysql – phpMyAdmin – “请输入有效长度”
  7. BZOJ4001[TJOI2015]概率论(数学、期望、生成函数、卡特兰数)
  8. I00010 打印1到输入数之间的回文数
  9. OpenGL基础51:泛光
  10. 如何使用Enigma Recovery检查设备未设置为加密备份
  11. Visual Studio Team System面面观系列课程幸运听众 又一次中奖,哈哈
  12. 学生签到系统c代码_学生信息管理系统C代码
  13. sqlalchemy的基本操作大全
  14. 802.11p WAVE notes
  15. 【BUUCTF - PWN】babyheap_0ctf_2017
  16. 让机器辨别气味:利用图神经网络预测分子的嗅觉属性
  17. java给word增加页码_Java 添加页码到Word文档
  18. 数字孪生智慧制造生产线项目实施方案,平台认知与概念
  19. 对话 IJCAI 07「卓越研究奖」得主 Alan Bundy :理解智能的本质是 AI 发展的终极目标
  20. Python每日一报

热门文章

  1. Android Design Support Library--FloatingActionButton及其Behavior的使用
  2. RM机器视觉——图像处理、识别装甲板(ROBOMASTER)
  3. 数据可视化基础——js篇
  4. 用友T6库存管理中,入库单保存后在单据列表里找不到此单据
  5. java ArrayList按照某个属性升序排序
  6. Java软件工程师需要掌握哪些知识技巧?
  7. 中国各级行政区划的英文表达
  8. python批量裁剪图片尺寸
  9. 计算机主板上的SATA接口是串行接口,sata接口怎么接 小编为您系统整理方法步骤【图文】...
  10. Python+Jpype 调用 Java 碰壁全记录