获取中国知网第一页论文的所有摘要

from selenium.webdriver import Chrome
from time import sleep
from bs4 import BeautifulSoupdef change_tab():all_resul = b.find_elements_by_css_selector('.result-table-list .name>a')# 遍历所有的标题for x in all_resul[:20]:x.click()sleep(1)b.switch_to.window(b.window_handles[-1])  # 切换到新创建的选项卡soup = BeautifulSoup(b.page_source, 'lxml')try:result = soup.select_one('#ChDivSummary').textexcept AttributeError:  # 异常处理result = Noneprint(result)b.close()  # 关闭新创建的选项卡b.switch_to.window(b.window_handles[0])  # 切换回第一个选项卡sleep(1)# 1. 基本操作
b = Chrome()  # 创建浏览器
b.get('https://www.cnki.net/')  # 打开中国知网
search_tag = b.find_element_by_id('txt_SearchText')  # 获取输入框
search_tag.send_keys('数据分析\n')  # 输入框输入'数据分析',然后按回车
sleep(1)
change_tab()
b.close()

获取中国知网第一页论文的所有摘要相关推荐

  1. (最详细教程)中国知网caj格式论文如何转化为word,pdf,txt

    在中国知网上下载的论文都是专门的caj形式,那么如何转化为Word形式便于编辑呢,一起来看吧 方法一: 1.最简单的一种就是用迅捷在线转化器,登陆迅捷官网首页 迅捷官网点击转到 2.点击CAJ转wor ...

  2. 如何通过中国知网获取期刊封面及目录页

    笔者前不久接到一个求助,希望提供某期刊某期的封面及目录页信息,该刊有其发表的论文,现急需.所在馆2012年期刊已经下架打捆(尚未送出装订),无功而返.笔者另行求助,得到中国知网产品经理吕蜜女士的帮助. ...

  3. Web of science以及中国知网学术论文爬取教程(附代码)

    我是目录 Web of Science 中国知网 最近又做了爬取知网以及web of science的工作,因此记录在这里.(话说这几天简直是要类吐血,之前看的论文累得全忘光光了,还得捡一下) 本期教 ...

  4. 喜报!《大数据》72篇论文入选中国知网《学术精要数据库》高影响力论文!...

    <大数据>2012-2022年共有72篇论文入选<学术精要数据库>"高影响力论文",其中高PCSI论文38篇,高被引论文42篇,高下载论文54篇," ...

  5. Python-Selenium Webdriver+google chrome浏览器爬取中国知网的文献概述

    Python-Selenium Webdriver+google chrome浏览器爬取中国知网的文献概述 目录 Python-Selenium Webdriver+google chrome浏览器爬 ...

  6. python爬虫为什么xpath路径正确却检索不到内容_中国知网爬虫

    一.知网介绍 提起中国知网,如果你曾经写过论文,那么基本上都会与中国知网打交道,因为写一篇论文必然面临着各种查重,当然翟博士除外.但是,本次重点不在于写论文跟查重上,而在于我们要爬取知网上一些论文的数 ...

  7. 网页打开共享目录_“馆员说事儿”之三大中文数据库期刊封面、目录、封底下载方法步骤(三)中国知网...

    三大中文数据库期刊封面.目录.封底下载方法步骤 -中国知网 三.中国知网 中国知网提供了各期刊封面.目录.封底的浏览及打印. 中国知网(CNKI)提供的封面.目录和封底信息,最早可到2008年,同样也 ...

  8. HttpUnit爬取中国知网特定大学网页

    继昨天使用Selenium+ChromeDriver爬取中国知网页面后,今天又想到了一些别的方法,就是HtmlUnit,作为一名萌新程序员,多写写总是好的,操蛋的是,还没想出好的爬取方法. 奉上jar ...

  9. Java使用Selenium+ChromeDriver 爬取中国知网

    Java使用Selenium 爬取中国知网 所需Jar包 中国知网的网页结构,我就不在这里赘述了,自己去看,这里我操作的是爬取博硕论文,只抓取前十页 当Selenium无法调取ChromeDriver ...

最新文章

  1. 华擎b365m itx 黑苹果_迷你ITX小机箱装机实录,黑苹果首选
  2. STM32F103ZET6开发板PB3/4,PA13/14/15等I/O口的特殊配置
  3. 1044 火星数字 (20 分)(c++)
  4. SetFormFullScreen()窗体全屏显示
  5. 电热水器工作过程 c语言,热水器工作流程图
  6. 注意.NET Core进行请求转发问题
  7. 容器编排技术 -- Kubernetes Replication Controller
  8. ModelArts微认证零售客户分群知识点总结
  9. 前后端分离后的前端时代 1
  10. 今天微信没有520红包 大家可以放心了!
  11. 封条格式用word怎么打_汽车密封条保养膏怎么用?大师来教你正确方法
  12. JavaSE----属性、方法
  13. 欧几里得求最大公约数--JAVA递归实现
  14. 解决电脑各种 dll 文件丢失问题
  15. 【iOS源码】懒人笔记应用源码
  16. k8s——Kubernetes配置yaml文件详解
  17. WORD转PDF格式快捷方法(转贴)
  18. python是由哪个人创造的文字_秦朝的文字是什么样的?是由谁创造出来的?
  19. 糖果(2019第十届蓝桥杯省赛C++A组I题) 解题报告(状压dp) Apare_xzc
  20. JDK Tomcat MySQL一键安装

热门文章

  1. SSM框架之通过id查询用户
  2. FusionInsight 华为hadoop集群客户端安装与使用
  3. 基于Matlab实现宽带调制转换器
  4. linux登陆密码后卡住,linux个别用户sftp坏掉,验证密码后卡住, 大概是什么问题?...
  5. 小议《三国志》“裴注”的真实性
  6. 线程池的几个主要参数的作用和运行原理
  7. Python基础——模块和包详解以及pip操作模块和包的指令
  8. 欧盟和美国在数据安全方面的现状
  9. java时间比较大小
  10. android 点击特效动画