文章目录

  • 一、软件介绍
  • 二、Python代码
  • 总结

一、软件介绍

为了避免在查找文献中频繁的打开sci-hub网站,写了一个调用sci-hub网站的小软件,输入SCI的DOI号即可打开文件。


如果文章查询不到:

二、Python代码

代码如下:

import tkinter as tk
import tkinter.messagebox
import requests
import re
import webbrowser
import threading
window=tk.Tk()
window.title('SCI-hub')
window.geometry('400x100')
l=tk.Label(window,text='DOI:',font=('Times New Roman',14),width=4,height=1)
t_1=tk.Entry(window,width=40)def find():var_text = t_1.get()doi = str(var_text).strip()url = 'https://sci-hub.et-fine.com/'url_find = url + doiheaders = {'authority': 'sci-hub.et-fine.com','cache-control': 'max-age=0','sec-ch-ua': '"Chromium";v="21", " Not;A Brand";v="99"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"Windows"','upgrade-insecure-requests': '1','user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36',}res = requests.get(url_find, headers=headers)ex = r' <iframe src=(.*?) id="pdf"></iframe>'try:object = re.findall(ex, res.text, re.S)[0]  # IndexError: list index out of rangewebbrowser.open(object)except IndexError:tk.messagebox.showerror(title='ERROR',message='SCI-hub没有此文件')res.close()pass
def find_2():th=threading.Thread(target=find)th.start()b_1 = tk.Button(window,text='查找',font=('宋体',12),command=find_2)l.place(x=5,y=20)
t_1.place(x=60,y=22)
b_1.place(x=180,y=65)
window.mainloop()

总结

代码中的headers字典最好使用自己浏览器中的headers进行伪装,网站:https://curlconverter.com/ ,可以快速的得到浏览器的headers。

一个方便查找SCI的爬虫软件相关推荐

  1. 用python代码做一个爬虫软件,给出完整代码

    爬虫软件通常用于抓取网站上的信息,下面是一个简单的 Python 爬虫软件的例子: import requests from bs4 import BeautifulSoupdef crawl(url ...

  2. 辟谣 | 爬虫软件真的可以获取隐私数据?真相只有一个

    随着网络安全实名制的发展,各大网站.APP均需要我们实名登录验证,那么以下场景你是否熟悉呢? 相信大家都有过类似的经历吧,从对话中反映了目前的普遍现象,很多朋友都认为爬虫可以采集用户的隐私数据. 大嗅 ...

  3. python爬虫抢火车票_如何用python写一个简单的12306抢票软件|python 爬火车票 教程...

    python 如果抓取验证码图片 类似12306的登录验证码图片 这个以前做次.最大的麻烦是码的识别算法的识别率太低.12306那种网站登陆错3次就限制你20分钟.所以除非你有33%以上的识别率否则不 ...

  4. Mac电脑安装Mangodb数据库,实现一个简单的Python页面爬虫

    Mangodb百度百科 使用Mac电脑有很多的软件没有Mac版本导致软件无法安装,但是有的软件有mac版本,安装方式也比Windows平台复杂.比如现在我们想在Mac电脑安装mangodb数据库,首先 ...

  5. 要玩大数据,没有数据怎么玩?这里推荐一些33款开源爬虫软件给大家。

    爬虫,即网络爬虫,是一种自动获取网页内容的程序.是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化. 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索 ...

  6. 一款非常强大的网络爬虫软件:Screaming Frog SEO Spider Mac(尖叫青蛙)

    seo spider是mac上一款非常强大的网络爬虫软件,可以抓取网站的网址,并且能够实时分析结果.它会收集关键的现场数据以便于SEO做出正确的决策.而且seo spider具有网页蜘蛛功能,您可以让 ...

  7. 好用的爬虫软件?动态ip软件告诉你

    现在网络上有很多的爬虫软件和爬虫教程,但是想要选择一个好的采集工具没有那么容易. 首先我不推荐的是网上的爬虫教程和源代码,并不是说它们不好,但是爬虫教程一般历时长,而且需要你能够学会相应的编程代码等等 ...

  8. 推荐几款爬虫软件与无需编程的数据分析工具

    爬虫软件: 八爪鱼,火车头,前嗅,熊猫采集器,集搜客等 相对来说八爪鱼配置还是比较简单的,不过免费版的爬起数据来那叫一个慢... 不过也可能是我是个急性子...1分钟爬10条,很心塞啊.火车头就尴尬, ...

  9. ️ 后羿采集器——最良心的爬虫软件

    2020 年如果让我推荐一款大众向的数据采集软件,那一定是后裔采集器了.和我之前推荐的 web scraper 相比,如果说 web scraper 是小而精的瑞士军刀,那后裔采集器就是大而全的重型武 ...

最新文章

  1. php进入目录,php文件,文件夹(目录)操作函数总结
  2. Hadoop集群扩展子节点
  3. Hi3516A开发--目录分析
  4. 我才知道wordpress还有com和org的区别呢
  5. android 代码设置EditText的hint字符
  6. 【J2ME 2D 游戏开发系列】◣HIMI游戏开发启蒙教程◢JAVA零基础学习J2ME游戏开发全过程!...
  7. uni-app微信小程序获取手机号;微信小程序获取手机号,获取到后需要进行解密;微信小程序获取手机号失败 Error:该appId没有权限
  8. LINUX系统中动态链接库的创建和使用
  9. 每天开豪车跟随老板出入高档会所,吃住高档酒店,这样的职场生活,有必要坚持下去吗?
  10. Journey Of Code组组员贡献率
  11. C++开发工程师的薪资和未来发展
  12. 数字电路基础知识——CMOS门电路 (与非门、或非、非门、OD门、传输门、三态门)
  13. 电阻何时取得最大功率
  14. android优化最强软件,手机提速谁最行?十款安卓优化软件比拼
  15. 基于百度飞桨PaddleOCR的图片文字识别
  16. Navicat Premium 12 for Mac 破解
  17. oracle rrsf_Oracle实战笔记(第三天)
  18. 找出数组中第k大和第m大的数字之和
  19. 搜索100亿网页 雅虎搜索放言技术已超百度
  20. 信息系统工程监理师一味的应和建设单位要求解决方法

热门文章

  1. c语言4位数求各位数的立方和,功能:使用循环结构求一个四位数的各位数字的立方和...
  2. python下载谷歌地图瓦片_python抓取天地图瓦片
  3. (渗透测试后期)Linux进程隐藏详解
  4. PAT乙级刷题心得和常用函数总结 (c++实现)
  5. 四月英语——你是人间四月天
  6. 无人机领域重大进展,即将实现空中充电
  7. 论文阅读【6】Autoaugment: Learning augmentation strategies from data
  8. 微信公众平台开发之Java实现群发消息
  9. Windows10下利用Visual Studio Code搭建C语言开发环境
  10. 东方博宜oj答案c++版