前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

又到一年毕业季

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):

url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'

salt = random.randint(1, 65536)

sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()

params = {

'from' :lan_from,

'to' :lan_to,

'salt' : salt,

'sign' : sign,

'appid' : appid,

'q': q

}

r = requests.get(url,params=params)

txt = r.json()

if txt.get('trans_result', -1) == -1:

print('ERROR Code:{}'.format(txt))

return q

return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。

python论文降重_论文怕被查重怎么办?你的降重神器来了相关推荐

  1. python教程推荐-入门python有什么好的书籍推荐?

    Python 越来越火爆,最近自己也在学习.整理下一些 Python 资料,和练手的项目.希望对你学习 Python 有所帮助. 如果大家想要文中 10G Python 编程视频,点击下面的卡片即可免 ...

  2. yolov5论文叫什么_论文格式与论文查重到底是什么鬼?教你半小时搞定的独门技巧...

    我们这里主要针对论文内容写作完成之后面临着字体.字号.文字格式等不统一,不符合学院要求等的问题做出合适的修改.排版以使论文格式符合学院要求. 毕业论文主要包括封面.论文原创性声明.中英文摘要及关键词( ...

  3. python论文题目大全_论文题目大全

    拟题的原则: 在表达清楚的基础上,尽量少用词,尤以名词短语最常见.论文题目要求确切.醒目.简洁.好读好记.概念明确.层次分明.抓住题目的四大要素(研究对象.研究目的.研究范围.研究方法).题目在用词上 ...

  4. python论文排版格式_论文排版(WPS版)——拿好不谢~~~

    今天要跟大家分享的内容是论文排版--WPS版! ▽▼▽ 昨天发了一篇关于word版的论文排版,阅读量还不错,果然是刚需,刚好今天没课,就趁热打铁,把WPS版的也分享给大家! ●●●●● 好久没用WPS ...

  5. python画棒棒糖程序_论文画图神器!25个常用Matplotlib图的Python代码,收藏收藏!...

    作者:zsx_yiyiyi 编辑:python大本营 大家好,今天要分享给大家25个Matplotlib图的汇总,在数据分析和可视化中非常有用,文章较长,可以马起来慢慢练手. # !pip insta ...

  6. python收集论文数据造假_论文数据造假被发现的可能有多大?

    不知道之前在哪看到的,造假水平的分类以及被发现的概率.具体原文不记得了,但大概意思还记得. 第1层:ps,重复贴图.这类方法不用解释,大家都理解,叫做照骗.这个现在被发现的可能性还是比较高的,尤其是专 ...

  7. hourglass论文_DSSD(1)_论文_arxiv2017

    本笔记记录DSSD,spotlight为: 1 把SSD中VGG16的backbone替换为Resnet-101,fig 1: 2 将de-conv添加至特征金字塔层的生成上,为检测模型引入了上下文信 ...

  8. python ip反查询_利用ip反查指定域名

    1.[利用ip反查指定域名代码][Python]代码 #!/usr/bin/python2.7 # -*- coding:utf-8 -*- import urllib,urllib2 import ...

  9. python 英语词汇量_最强“扫地僧”!北大保安小哥英语词汇量一万五,会用Python编程,网友:北大保安都不会招我...

    原标题:最强"扫地僧"!北大保安小哥英语词汇量一万五,会用Python编程,网友:北大保安都不会招我 11月11日下午3时,北大官方微博发文"遇见最强扫地僧!北大保安小哥 ...

  10. 数据库和python有关系吗_想问一下,数据跟代码种类有关系么? 比如我用MySQL数据库,必须要用python或者JAVA之类的要求...

    你可以访问python数据库接口及api查看详细的支持数据库列表.不同的数据库你需要下载不同的db api模块,例如你需要访问oracle数据库和mysql数据,你需要下载oracle和mysql数据 ...

最新文章

  1. windows10 上运行 linux -- WSL(Windows Subsystem for Linux)
  2. JUnit 5和Selenium –使用Gradle,JUnit 5和Jupiter Selenium设置项目
  3. springboot 接口404_资深架构带你学习Springboot集成普罗米修斯
  4. OpenCV图像的编解码读取
  5. Thinking in Java Chapter 14
  6. Android APP开发入门教程
  7. PhpStorm设置格式化代码快捷键
  8. 一个不错的shell 脚本教程
  9. 在 Windows 安装期间将 MBR 磁盘转换为 GPT 磁盘
  10. pdf.js渲染不对 问题回顾
  11. php和java做众筹系统哪个好,Java版众筹系统和PHP众筹系统对比分析
  12. E. The Humanoid
  13. 【视频课】行为识别课程更新!CNN+LSTM理论与实践!
  14. VisualStudio各个版本彻底干净卸载
  15. 新型计算机教学方式,电脑教学中的“新”
  16. mysql安装简书_MySQL 安装
  17. c语言饭卡管理系统_C语言饭卡管理系统(附代码).doc
  18. 【phpstudy】在windows上开启后访问php页面显示502
  19. 关于美国FBA海运操作流程以及费用详解
  20. 使用爱加密生成带有签名的

热门文章

  1. 第 2 届河北省大学生程序设计竞赛(河北省赛)-Problem C. icebound 的账单-题解
  2. Catia抛物线建模_基于CATIA的方程曲线设计建模研究
  3. 基于java小区物业管理系统
  4. Whiteboard for mac(mac画图软件)
  5. android黑域系统文件,优雅地使用安卓手机,黑域免root使用教程
  6. C#实战之CAD二次开发005:打印pdf
  7. 深度学习面试题集锦【1】
  8. 岩土工程颗粒流软件PFC6.0技巧——按计算时间导出数据、图像及保存文件
  9. python实现信号预加重
  10. CSRF - 跨站请求伪造