用到的包:

  • BeautifulSoup
  • pymysql
  • requests
  • json

碰到的问题:

1.医生查询分页数据不能超过38页,超过无法返回数据

2.某些字段对应的html元素包含一些无效的class,导致通过BeautifulSoup获取不到该字段

3.按地区搜索医院列表的分页数据不能超过100页,超过返回的重复数据,导致需要手工删除hospital,department两张表code重复的记录

4.一个医生可能出现在多个科室,所以按科室获取医生列表并插入数据库时需要判断重复

5.按地区查找医院时,香港、澳门两个城市的地区查出来的是广东的医院,导致产生大量重复的医院,需要手工删除

6.患者评论数据分页数据  需要获取签名+时间戳才能取到下一页数据,并且未登录只能获取前5页数据,要获取所有数据需要登陆, 登陆以后最多能取60页数据

7.登陆页面需要滑动验证,如果不想花时间研究登陆,可以直接在浏览器中登陆一个微医账户,然后把登陆后的cookie保存下来传给request请求

附代码:https://github.com/xienb/weiyi.git

转载于:https://www.cnblogs.com/xienb/p/11328483.html

使用python获取微医数据相关推荐

  1. python 行情数据,拼多多股票:Python获取股票行情数据的一种方法

    Python获取股票行情数据的一种方法 拼多多股票 本号帮大家找了一个可免费获取股票行情数据的接口. Tushare社区目前主要维护新版本:tushare pro,数据更稳定拼多多股票质量更高,可获取 ...

  2. 为了提前预测比赛结果,于是我用Python获取比赛球员数据进行分析,结果...

    为了提前预测比赛结果,于是我用Python获取比赛球员数据进行分析,结果... 前因后果 准备工作 实现步骤 代码展示 部分效果展示 最后 前因后果 最近不是世界杯嘛,但是太忙了实在没时间看,于是为了 ...

  3. Python获取电子书籍数据

    Python获取电子书籍数据-以当当网为例 (一)以css方式获取 import requests,csv from bs4 import BeautifulSoup import codecs #自 ...

  4. 利用python获取word图表数据和修改图表信息

    利用python获取word图表数据和修改图表信息 起因咸鱼有个人问word怎么修改图表信息,想用docx库找不到关于图表的方法,这里用了Win32com. import time import wi ...

  5. python获取计算机信息系统数据罪_工作心得:破坏计算机信息系统罪与非法获取计算机信息系统数据罪的区分...

    工作心得: 破坏计算机信息系统罪与非法获取计算机信息系统数据 罪的区分 非法获取计算机信息系统数据罪与破坏计算机信息系统罪的主要区别有以下 两点: (1) 犯罪行为不同.前罪犯罪行为为非法获取数据,后 ...

  6. 使用python获取美股行情数据

    使用python获取美股GME一月数据,包括开盘价.收盘价.最高价.最低价.成交量等 工具包:pandas_datareader 环境安装 pip install pandas_datareader ...

  7. 使用Python获取最新疫情数据,制作可视化动态地图,实时展示各地情况

    愿世界再无病痛,盼疫情早日结束 序言 效果展示 准备工作 代码展示 序言 疫情降临转眼已经第三年了,时间过得真快,愿疫情早点结束,世界不再多灾多难. 最近疫情稍微好转一些了,所以咱们获取一下最新的疫情 ...

  8. Python获取用电情况数据-AHPU校园网

    我写这个主要是想把寝室的用电情况给保存下来,做一些分析统计之类的.代码运行在一台树莓派上面,树莓派连着校园网. 正文 首先看看浏览器网页查询页面. 在写代码之前我们要先获取一些参数,而用这些参数可以让 ...

  9. Python获取全部股票数据

    目前整个沪深京A股市场总共有5000余支股票,那么我们怎么能获取到这些股票的数据(股价.市值.市盈率.市净率等)呢? 小编常用的有三个网站,分别是东方财富.同花顺.雪球,请自行查阅. 我们以东方财富为 ...

最新文章

  1. Silverlight同步(Synchro“.NET研究”nous)调用WCF服务
  2. Github 最新 AI 开源项目了解一下?
  3. Scala的隐式参数、隐式值、隐式对象
  4. 怎么创建dllwenjian_如何创建和使用dll及lib文件
  5. java.lang.NoClassDefFoundError:如何解决–第2部分
  6. 用Visual C#来清空回收站(2)
  7. 微课|Python程序设计开发宝典(5.2.2):默认值参数
  8. 【操作系统/OS笔记17】文件系统基本概念、文件描述符、文件系统访问、文件别名、文件系统种类
  9. java调用arcgis soe发布的rest服务,中文传值乱码问题
  10. MySQL命令行格式化输出
  11. mvnrepository.com jar包下载
  12. delphi调用python_Delphi使用Python来解码邮件
  13. Open Database causes ORA-600: kcratr_scan_lastbwr
  14. C语言函数参数传递详解
  15. 2019-CS224n-Assignment1
  16. 手把手教你写让人眼前一亮的软件测试简历,收不到面试邀请算我输
  17. 期末GIS人的《计量地理学》突击复习有救了
  18. 数据库安全性和完整性考虑_您是否考虑过云安全性?
  19. oracle做分页式报表,报表性能优化方案之单数据集分页SQL实现层式报表
  20. 备用手机如何自动转发短信和验证码

热门文章

  1. Single Image Haze Removal Using Dark Channel Prior
  2. 浅谈互联网DD攻击和CC攻击
  3. 匿名科创无人机学习心得
  4. oracle计算timestamp差,Oracle 计算timestamp和date类型的时间差
  5. 注意力机制(Attention)
  6. Django cms 教程三:创建模板
  7. origin中图片的正确输出方式
  8. 输出21世纪中截止某个年份以来的所有闰年年份。注意:闰年的判别条件是该年年份能被4整除但不能被100整除、或者能被400整除。
  9. 输出1-100之内的所有质数
  10. 我眼中的匈牙利命名法