一、软件介绍

为了避免在查找文献中频繁的打开sci-hub网站，写了一个调用sci-hub网站的小软件，输入SCI的DOI号即可打开文件。

如果文章查询不到：

二、Python代码

代码如下：

import tkinter as tk
import tkinter.messagebox
import requests
import re
import webbrowser
import threading
window=tk.Tk()
window.title('SCI-hub')
window.geometry('400x100')
l=tk.Label(window,text='DOI:',font=('Times New Roman',14),width=4,height=1)
t_1=tk.Entry(window,width=40)def find():var_text = t_1.get()doi = str(var_text).strip()url = 'https://sci-hub.et-fine.com/'url_find = url + doiheaders = {'authority': 'sci-hub.et-fine.com','cache-control': 'max-age=0','sec-ch-ua': '"Chromium";v="21", " Not;A Brand";v="99"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"Windows"','upgrade-insecure-requests': '1','user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36',}res = requests.get(url_find, headers=headers)ex = r' <iframe src=(.*?) id="pdf"></iframe>'try:object = re.findall(ex, res.text, re.S)[0]  # IndexError: list index out of rangewebbrowser.open(object)except IndexError:tk.messagebox.showerror(title='ERROR',message='SCI-hub没有此文件')res.close()pass
def find_2():th=threading.Thread(target=find)th.start()b_1 = tk.Button(window,text='查找',font=('宋体',12),command=find_2)l.place(x=5,y=20)
t_1.place(x=60,y=22)
b_1.place(x=180,y=65)
window.mainloop()

总结

代码中的headers字典最好使用自己浏览器中的headers进行伪装，网站：https://curlconverter.com/ ，可以快速的得到浏览器的headers。

一个方便查找SCI的爬虫软件相关推荐

用python代码做一个爬虫软件，给出完整代码
爬虫软件通常用于抓取网站上的信息,下面是一个简单的 Python 爬虫软件的例子: import requests from bs4 import BeautifulSoupdef crawl(url ...
辟谣 | 爬虫软件真的可以获取隐私数据？真相只有一个
随着网络安全实名制的发展,各大网站.APP均需要我们实名登录验证,那么以下场景你是否熟悉呢? 相信大家都有过类似的经历吧,从对话中反映了目前的普遍现象,很多朋友都认为爬虫可以采集用户的隐私数据. 大嗅 ...
python爬虫抢火车票_如何用python写一个简单的12306抢票软件|python 爬火车票教程...
python 如果抓取验证码图片类似12306的登录验证码图片这个以前做次.最大的麻烦是码的识别算法的识别率太低.12306那种网站登陆错3次就限制你20分钟.所以除非你有33%以上的识别率否则不 ...
Mac电脑安装Mangodb数据库，实现一个简单的Python页面爬虫
Mangodb百度百科使用Mac电脑有很多的软件没有Mac版本导致软件无法安装,但是有的软件有mac版本,安装方式也比Windows平台复杂.比如现在我们想在Mac电脑安装mangodb数据库,首先 ...
要玩大数据，没有数据怎么玩？这里推荐一些33款开源爬虫软件给大家。
爬虫,即网络爬虫,是一种自动获取网页内容的程序.是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化. 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索 ...
一款非常强大的网络爬虫软件：Screaming Frog SEO Spider Mac(尖叫青蛙）
seo spider是mac上一款非常强大的网络爬虫软件,可以抓取网站的网址,并且能够实时分析结果.它会收集关键的现场数据以便于SEO做出正确的决策.而且seo spider具有网页蜘蛛功能,您可以让 ...
好用的爬虫软件？动态ip软件告诉你
现在网络上有很多的爬虫软件和爬虫教程,但是想要选择一个好的采集工具没有那么容易. 首先我不推荐的是网上的爬虫教程和源代码,并不是说它们不好,但是爬虫教程一般历时长,而且需要你能够学会相应的编程代码等等 ...
推荐几款爬虫软件与无需编程的数据分析工具
爬虫软件: 八爪鱼,火车头,前嗅,熊猫采集器,集搜客等相对来说八爪鱼配置还是比较简单的,不过免费版的爬起数据来那叫一个慢... 不过也可能是我是个急性子...1分钟爬10条,很心塞啊.火车头就尴尬, ...
️ 后羿采集器——最良心的爬虫软件
2020 年如果让我推荐一款大众向的数据采集软件,那一定是后裔采集器了.和我之前推荐的 web scraper 相比,如果说 web scraper 是小而精的瑞士军刀,那后裔采集器就是大而全的重型武 ...

一个方便查找SCI的爬虫软件

文章目录

一、软件介绍

二、Python代码

总结

一个方便查找SCI的爬虫软件相关推荐

最新文章

热门文章