获取中国知网第一页论文的所有摘要
获取中国知网第一页论文的所有摘要
from selenium.webdriver import Chrome
from time import sleep
from bs4 import BeautifulSoupdef change_tab():all_resul = b.find_elements_by_css_selector('.result-table-list .name>a')# 遍历所有的标题for x in all_resul[:20]:x.click()sleep(1)b.switch_to.window(b.window_handles[-1]) # 切换到新创建的选项卡soup = BeautifulSoup(b.page_source, 'lxml')try:result = soup.select_one('#ChDivSummary').textexcept AttributeError: # 异常处理result = Noneprint(result)b.close() # 关闭新创建的选项卡b.switch_to.window(b.window_handles[0]) # 切换回第一个选项卡sleep(1)# 1. 基本操作
b = Chrome() # 创建浏览器
b.get('https://www.cnki.net/') # 打开中国知网
search_tag = b.find_element_by_id('txt_SearchText') # 获取输入框
search_tag.send_keys('数据分析\n') # 输入框输入'数据分析',然后按回车
sleep(1)
change_tab()
b.close()
获取中国知网第一页论文的所有摘要相关推荐
- (最详细教程)中国知网caj格式论文如何转化为word,pdf,txt
在中国知网上下载的论文都是专门的caj形式,那么如何转化为Word形式便于编辑呢,一起来看吧 方法一: 1.最简单的一种就是用迅捷在线转化器,登陆迅捷官网首页 迅捷官网点击转到 2.点击CAJ转wor ...
- 如何通过中国知网获取期刊封面及目录页
笔者前不久接到一个求助,希望提供某期刊某期的封面及目录页信息,该刊有其发表的论文,现急需.所在馆2012年期刊已经下架打捆(尚未送出装订),无功而返.笔者另行求助,得到中国知网产品经理吕蜜女士的帮助. ...
- Web of science以及中国知网学术论文爬取教程(附代码)
我是目录 Web of Science 中国知网 最近又做了爬取知网以及web of science的工作,因此记录在这里.(话说这几天简直是要类吐血,之前看的论文累得全忘光光了,还得捡一下) 本期教 ...
- 喜报!《大数据》72篇论文入选中国知网《学术精要数据库》高影响力论文!...
<大数据>2012-2022年共有72篇论文入选<学术精要数据库>"高影响力论文",其中高PCSI论文38篇,高被引论文42篇,高下载论文54篇," ...
- Python-Selenium Webdriver+google chrome浏览器爬取中国知网的文献概述
Python-Selenium Webdriver+google chrome浏览器爬取中国知网的文献概述 目录 Python-Selenium Webdriver+google chrome浏览器爬 ...
- python爬虫为什么xpath路径正确却检索不到内容_中国知网爬虫
一.知网介绍 提起中国知网,如果你曾经写过论文,那么基本上都会与中国知网打交道,因为写一篇论文必然面临着各种查重,当然翟博士除外.但是,本次重点不在于写论文跟查重上,而在于我们要爬取知网上一些论文的数 ...
- 网页打开共享目录_“馆员说事儿”之三大中文数据库期刊封面、目录、封底下载方法步骤(三)中国知网...
三大中文数据库期刊封面.目录.封底下载方法步骤 -中国知网 三.中国知网 中国知网提供了各期刊封面.目录.封底的浏览及打印. 中国知网(CNKI)提供的封面.目录和封底信息,最早可到2008年,同样也 ...
- HttpUnit爬取中国知网特定大学网页
继昨天使用Selenium+ChromeDriver爬取中国知网页面后,今天又想到了一些别的方法,就是HtmlUnit,作为一名萌新程序员,多写写总是好的,操蛋的是,还没想出好的爬取方法. 奉上jar ...
- Java使用Selenium+ChromeDriver 爬取中国知网
Java使用Selenium 爬取中国知网 所需Jar包 中国知网的网页结构,我就不在这里赘述了,自己去看,这里我操作的是爬取博硕论文,只抓取前十页 当Selenium无法调取ChromeDriver ...
最新文章
- 华擎b365m itx 黑苹果_迷你ITX小机箱装机实录,黑苹果首选
- STM32F103ZET6开发板PB3/4,PA13/14/15等I/O口的特殊配置
- 1044 火星数字 (20 分)(c++)
- SetFormFullScreen()窗体全屏显示
- 电热水器工作过程 c语言,热水器工作流程图
- 注意.NET Core进行请求转发问题
- 容器编排技术 -- Kubernetes Replication Controller
- ModelArts微认证零售客户分群知识点总结
- 前后端分离后的前端时代 1
- 今天微信没有520红包 大家可以放心了!
- 封条格式用word怎么打_汽车密封条保养膏怎么用?大师来教你正确方法
- JavaSE----属性、方法
- 欧几里得求最大公约数--JAVA递归实现
- 解决电脑各种 dll 文件丢失问题
- 【iOS源码】懒人笔记应用源码
- k8s——Kubernetes配置yaml文件详解
- WORD转PDF格式快捷方法(转贴)
- python是由哪个人创造的文字_秦朝的文字是什么样的?是由谁创造出来的?
- 糖果(2019第十届蓝桥杯省赛C++A组I题) 解题报告(状压dp) Apare_xzc
- JDK Tomcat MySQL一键安装