简单爬取Library genesis 免费文献下载网
Library genesis 免费文献下载网(列表简单)
import requests.
import pandas as p
from bs4 import BeautifulSoup as bs
def spider(url):req=requests.get(url)req.encoding='utf-8'return bs (req.text,'html.parser')
def pandaWork(lis1,lis2,lis3):data=p.DataFrame({'ID':lis1,'作者':lis2,'书名':lis3})w=p.ExcelWriter('Lg图书馆.xlsx')data.to_excel(w,'Lg图书馆')w.save()
lis1=[]
lis2=[]
lis3=[]
for i in range(5):url='http://gen.lib.rus.ec/search.php?&req=the+critique+of+pure+reason&phrase=1&view=simple&column=def&sort=def&sortmode=ASC&page=%d'%(i+1)pbj=spider(url)for i in pbj.find_all('tr',valign="top",bgcolor="#C6DEFF"):lis1.append(i.find_all('td')[0].text)lis2.append(i.find_all('td')[1].find('a').text)lis3.append(i.find_all('td')[2].find('a').text)
pandaWork(lis1,lis2,lis3)
简单爬取Library genesis 免费文献下载网相关推荐
- 怎么用python爬取老师_requests简单爬取佩奇老师Python目录下的文章内容
#coding:utf-8 import requests import xlrd from xlutils.copy import copy import time from bs4 import ...
- Scrapy-Redis 爬取快代理免费
前面写过使用scrapy爬取快代理的免费ip 接下来使用的是基于Redis的分布式scrapy爬取快代理免费ip 1.准备好Redis 如何安装和使用Redis这里就不做介绍了,没有安装的可以参考我之 ...
- python医学科研中能做什么-这个工具,可全网爬取科研圈中外文献!
原标题:这个工具,可全网爬取科研圈中外文献! 作为「科研汪」,你是不是也经常幻想下一刻实验现象就按照自己预想的呈现,再发个大 paper,走上人生巅峰. 好了,少年该醒醒了. 回到现实,要查文献.管理 ...
- 数据挖掘 文本分类 知乎问题单分类(二):爬取知乎某话题下的问题(数据爬取)
数据挖掘 文本分类 知乎问题单分类(二):爬取知乎某话题下的问题(数据爬取) 爬虫目标 Scrapy框架介绍 Scrapy框架原理 [^1] Scrapy工作流程 [^2] 具体实现 安装Scrapy ...
- Scrapy学习之第一个简单爬取小程序
1.首先,先安装scrapy模块,使用命令:pip install scrapy,安装如果出现error: Microsoft Visual C++ 14.0 is required错误的话可参考文章 ...
- python实战1.0——爬取知乎某问题下的回复
python实战1.0--爬取知乎某问题下的回复 确定问题 爬取 进行简单筛选 保存数据 # 获取问题下的回复总数 def get_number():url = 'https://www.zhihu. ...
- 用PYTHON爬虫简单爬取网络小说
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...
- Scrapy笔记十二:简单爬取苏宁书籍网站
文章目录 简单爬取苏宁书籍网站 参考网址: 整个爬取过程思路: 未解决的问题: 代码如下: 简单爬取苏宁书籍网站 参考网址: 网址1:https://book.suning.com/ 网址2:http ...
- 爬一个人的所有微博 python_Python爬虫--爬取微博指定用户主页下的所有图片
Python爬虫--爬取微博指定用户主页下的所有图片 写在前面 最近比较无聊,冒出来一个想法,去各大图片网站爬取大妹子的图片,然后自己写个简单的网站,按网站分类显示图片,第一个想到的是爬取知乎问题下面 ...
最新文章
- 【通俗理解线性代数】 -- 特殊的矩阵
- 2020 年 11 月程序员工资统计,Java 市场占有率仍第一
- JavaBean技术
- python requests java_java实现类似python requests的session功能
- python中的pass语句_Python中pass的作用与使用代码示例
- java可视化界面视频_java中的可视化界面
- 迅雷的声音:摆脱视频产业的经济化困境
- 从逻辑回归到最大熵模型
- if函数python作用_if __name__== __main__ 的意思(作用)python代码复用
- js上传视频,预览视频
- 设计师效率帮手|提高设计效率的Sketch插件!
- Java和JavaScript在网页设计中的区别,了解一下吧
- python requests 10041报错_Python:requests高级_模拟登陆
- (Matlab实现)基于蒙特卡洛模拟的大规模电动车充电模型
- Java创造者詹姆斯·高斯林采访
- Win7 - 隐藏计算机中收藏夹和库
- 计算机博士有哪些专业方向,国内计算机专业博士研究方向-20210619140356.docx-原创力文档...
- 从键盘上输入以下的数据:TOM:89|JERRY:90|TONY:95,数据格式为“姓名:成绩|姓名:成绩|姓名:成绩”,对输入的内容按成绩进行排序,并将结果按成绩由高到低排序。
- 局部敏感哈希-Locality Sensitivity Hashing
- 参数校验@Valid