[论文写作笔记] C11论文查重原理及降重
文章目录
- 1、查重的必要性
- 2、重复原因
- 情形1:题目的核心要素类似,容易重复
- 情形2:研究背景相似,模仿后容易重复
- 情形3:综述当前研究成果
- 情形4:相同或相似研究方法,易重复
- 情形5:研究变量相似,结果易重复
- 情形6:无法和难以避免的重复
- 3、权威查重算法的原理
- 论文重复的常见类型
- 最新查重算法覆盖范围
- 论文查重报告
- 4、降重的方法及案例分析
- 主要降重方法及流程介绍
- 5、问题答疑
编辑一旦发现论文的重复率过高(即和已发表的论文数据库中的某一篇或多篇论文高度相似),就会直接拒稿或退回。
重复率等于论文中重复的单词个数除以论文参与查重的总字数(原则上参考文献不参与查重)。
在查重报告中,一般用SimilarityScore(相似度分数)或Similarity Index(相似度指数)表示重复率,两者的定义没有任何差别。
我们想强调的是,学会改写不是为了更好地拷贝再转化成自己的写作,而是让大家更好地学会消化吸收和引用参考已发表的论文,特别是论文的引言和材料方法部分以及综述性论文的写作方法。
1、查重的必要性
国际上越来越多的SCI期刊设置了论文预筛选环节
,即编辑在查看论文内容之前,用查重软件对提交上来的论文进行查重。
即使论文侥幸通过编辑预审和审稿人审稿而发表,在论文见刊后也需要接受读者的审阅。
2、重复原因
重复可分为故意重复
(即直接挪用他人写作成果)和无意重复
(即自己写的内容也会重复)。
对无意重复的6个主要原因从SCI论文的各个部分进行解释说明。
情形1:题目的核心要素类似,容易重复
由于题目中包含的核心关键词在同一领域中很可能一样,因此如果研究内容和已发表论文的研究内容相似,那么就很可能出现题目高度重复的情况
题目重复的主要原因是题目的核心要素相似,如研究的对象、研究的变量、研究的条件、研究理论/方法/关系
等。这些核心要素常常被写在一些常用的表达中,比如题目的经常写法
有(加粗表示研究对象或条件):
- Effect of Transformed Letters on Reading Speed
- Effect of Captopril on Mortality and Morbidity in Patients
- Material Properties of Cold-Formed High Strength Steel at Elevated Temperatures
- Electronic Properties of Two-Dimensional Systems
- Experimental / Numerical / Theoretical Study of Industrial Wastewater Treatment by Freezing
- Experimental/Numerical/Theoretical Study of the BEC-BCS CrossoverRegion in Lithium 6
- Tool Condition Monitoring Using Artificial Intelligence Methods
- Nonlinear Modelling of Switched Reluctance Motors Using ArtificialIntelligence Techniques
虽然论文题目的字数很少,即便被查出有重复也不会对全文整体的重复率有较大影响,但是如果被SCI期刊编辑发现高度重复,就很可能会判断我们的论文是在重复前人的研究
,也就是说创新性很差,很有可能直接被编辑拒稿
。
情形2:研究背景相似,模仿后容易重复
在引言的写作中,首先要在第一段介绍研究背景
,这在两种情况下容易造成重复。
- 情况1:在引言的第一段中描述和国际同行相似的研究背景。
- 情况2:作者自己的某一个课题成果较为丰富,可以就该成果连续发好几篇论文,而每篇论文的大背景大同小异,这样引言中的研究背景部分则容易造成自我重复。
情形3:综述当前研究成果
在引言中,容易出现重复的第二个部分是对前人研究成果的总结概括
。如果没有高度概括前人的研究成果,就容易出现短语结构和关键词重复的情况。
或者选用一些常见的短语
进行概括,也有可能出现重复的情况,例如a number of experimental and numerical studies on。
此外,在报道某种情况或数据
时,由于数据和报道的对象都是统一的,就容易造成重复。
情形4:相同或相似研究方法,易重复
如果我们的论文研究方法和国际同行类似,往往需要参考已发表论文中的方法和具体步骤。其中那些较为标准和通用的方法步骤往往可以被借鉴。
同时,如果我们已经发表过使用某个试验方法或数值分析方法的论文,在新的论文中需要再次描述同一方法,就很容易造成自我重复
情形5:研究变量相似,结果易重复
如果使用和已发表的论文中相同的试验或模拟方法,特别是和自己已发表论文中的实验方法相同,且测量的变量也相同,就会出现在论文结果部分使用和已发表论文结果部分相类似的句子结构去表达的情况。
情形6:无法和难以避免的重复
目前的计算机查重算法将有固定表达
的作者单位信息(Affiliations)、变量说明(Notations)、相对固定的致谢(Acknowledgement)、利益冲突申明(Conflict of Interest Statement)和道德申明(Ethical Statement)都纳入查重范围,因此这五部分一般都会被算作重复部分。不过大部分SCI期刊编辑都理解这些部分的重复,而且它们字数很少,因此不会对全文的重复率有大的影响。
3、权威查重算法的原理
理论上,判断论文内容是否重复的方法是看论文中的想法是否来自于作者自己,且用自己的话表达
;如果不是,则要看是否将借鉴的内容进行了恰当改写并且写上了参考文献
。因此,想要避免重复,则要在论文中用自己的话表达原创的想法,否则就要改写并附上参考文献。
论文重复的常见类型
(1)复制粘贴重复
是指克隆式地去照抄别人论文中的语句,是一种“暴力”重复,是绝对逃不出目前查重算法的法网的。---------- 字符串精确匹配算法
(即一句话中连续重复3个及以上单词即可判定为重复)
(2)伪装式重复
是指对原文的形式进行小改动,且没有加双引号明确指出引用的内容,比如表11.2中下划线部分的句子就是伪装式重复句子。 ---------- 字符串精确匹配算法
(3)改写式重复
是指通过意译改写句子,即保持句子意思不变,但重新用自己的话表达出来。
(4)翻译式重复
是指翻译其他语言的论文,保持译文与原文意思一致,比如将英文论文翻译成中文论文,并在中文期刊上发表,这样的操作就可以被称作翻译式重复。
(5)想法重复
是指论文中语句表达出来的想法存在雷同,即语句表达的核心意思一致,但是语言表达的形式不同。
最新查重算法覆盖范围
目前绝大多数国际SCI期刊采用的权威查重算法是一种基于语言风格的算法
- 字符串精确匹配
理解句子结构
(只要句子结构和原文类似,那么即使句子中的部分单词不同,剩余重复的单词也照样可以被查出,即便是常用的介词或冠词)
不过,目前最先进的查重算法的识别程度还只能局限在句子结构上,而不能理解单词的含义
,即不能在语义上进行查重,比如近义词替换后就可以躲开重复。
总结一下,目前的最新权威查重算法能覆盖所有的“复制粘贴重复”和“伪装式重复”,部分覆盖“改写式重复”。这就意味着,对于准备投稿国际SCI期刊的作者,只要避免暴力的“复制粘贴重复”以及对原文表达形式进行小变动的“改写式重复”,以及采用正确的改写方法,就能大幅度降低重复率,从而成功通过SCI期刊的查重预筛选。
目前受到国际SCI期刊认可程度最高的查重软件是iThenticate
。
论文查重报告
期刊编辑主要看的是总的重复率
,但是也看重复的具体情况。
比如一篇论文的重复率是20%,表示有20%的文字和数据库中的一篇或多篇论文重复。重复的部分既可以是和单独一篇论文重复(单篇20%的重复率),也可以和20篇论文重复(每篇论文1%的重复率)。很明显,前者重复的情况要比后者严重得多,因为作者有可能大幅度复制同一篇论文。因此,如果重复的篇数很多且每篇论文重复率都很低,比如1%,那么有一个高的总重复率的论文也不一定被判定为重复。这也告诉我们,要判断论文重复的程度可以先看是零散的单词或句子重复,还是整段或多段文字的集中重复
。
同时,即便同一重复率下,在不同位置
的重复也会产生不同的重复结果。比如,在实验方法部分
重复就比在结果、讨论和结论部分
重复的程度要轻。这是因为描述材料、实验分析方法和过程的语句形式变化有限,从而容易造成重复,这通常可被期刊编辑所理解。然而论文的结果、讨论和结论部分是体现论文个性和创新性的核心部分,也就意味着不能和其他论文重复,这也是编辑会比较严苛对待的部分。
此外,论文的类型
也会影响期刊编辑判断期刊的重复程度。比如综述性论文就比原创性论文更加容易造成重复。因为在综述性论文中,作者需要大量地总结前人的研究成果,几乎没有或较少地贡献原创数据和分析。但是笔者强烈建议大家在理解前人研究成果的基础上用自己的话表述,这是写综述性论文的基本要求。
因此,期刊编辑在拿到论文的查重报告后,会首先看总的重复率,再考虑重复的分布、重复的主要位置、论文类型等来判断重复程度。由于单一的总重复率不能决定重复的严重性,因此目前国际上并没有统一的最低重复率标准,即不能说哪一个具体的重复率以下的重复程度可算作合格。
因此,我们可以认为,总重复率在10%以下
且单篇不超过5%
会比较安全,基本不会算作重复;但如果总重复率超过20%,这样的论文基本会判定为严重重复。
4、降重的方法及案例分析
主要降重方法及流程介绍
值得注意的是,改写时要遵守句子意思不变或相近的原则。主要降重方法及流程
:首先应理解要改写句子的意思,然后在整体形式上改变句子结构
(比如复杂句与简单句转换、主动句与被动句转换等),并进行局部改动
,比如词组变换、同义词替换、单词形式变化(单复数变化、动词与名词转换、名词与形容词转换等)
(1)改写句子结构
的例子,以复杂句与简单句转换为例,比如:
复杂句:Based on the WL theory, Wang et al.developed an analytic model, which combinesthe Fourier synthesis method and the time-dependent linear stability analysis, to predict theinterface structures.
简单句:Based on the WL theory, Wang et al.developed an analytic model to predict theinterface structures.This model combines the Fourier synthesis method and the time-dependent linear stability analysis.
(2)词组变换
,以名词所有格变换为例:the influence of…factor与the factor’s influence。
(3)同义词替换
的例子,比如:use和utilize; a positive change与an improvement。
(4)单复数变化
的例子,比如:result与results。
(5)动词与名词转换
的例子,比如:We consider….与The consideration of…
(6)名词与形容词转换
的例子,比如:The experiment was a success与The experiment was successful。
其他改写技巧:
(1)单复数变换不算重复
,比如可将apple改成apples。
(2)图形
不会记入查重,即可将表格中的数据用图形表示。
(3)多次出现的专业词组改成简写
,比如可将sea spray generation function改写为SSGF。
具体案例还是自己看原书吧,不整理了。
5、问题答疑
Q: 为什么一些非常基础的词汇,比如and, on, the, of等词都会被查重识别出来?
这是因为它们所在的句子和前人发表过的句子结构上相似,且这些简单词又在已发表论文的相似句子结构中出现。句子相似是目前权威查重算法能有效识别的,具体见本讲11.3。比如句子“I like appleand orange.”其句子结构为“…like A and B.”那么这个相似句子“You like watermelon andbanana”中的like和and就是重复词。
[论文写作笔记] C11论文查重原理及降重相关推荐
- 2篇word文档比较重复率_本科论文写作重复率高的原因,毕业论文降重技巧总结!...
论文重复率的问题,是大学高等院校都比较关心的一点,大学生在论文写完以后,都要经过知网论文检测,在查看重复报告的时候,无法直视,因为论文重复率提高啦.经过几次论文降重修改还是没法降低论文重复率.那么论文 ...
- 【论文写作】英文论文写作指南
英文论文写作指南 学术研究与论文写作 以CCF A类论文为标准写论文. 做科研对我们的培养 方法论(拥有解决问题的能力) 发现问题.系统地调研(大家用了哪些方法,有什么问题).寻找有效方法.实践验证, ...
- 【Stata】Stata计量论文写作:实证论文如何写作?
Stata计量论文写作:实证论文如何写作? 一.论文三支柱 二.详细例子解说 2.1 描述性统计 2.2 相关性分析 2.3 实证分析 2.3.1 回归 2.3.2 显著性 2.4 导出实证结果 一. ...
- 【毕业论文】免费查重网站及降重软件
毕业论文免费查重网站及降重软件 免费查重网站 高效论文降重工具 免费查重网站 万方免费查重(应届生免费一次):https://chsi.wanfangtech.net/ PaperDay(标准版永久免 ...
- [论文写作笔记] C3 让题目闪光
文章目录 3.1题目的写作要求 3.2题目的长度 3.3题目的类型 3.3.1 方法描述型题目 3.3.2 结果描述型题目 3.4写作思路 Q & A 论文题目是读者阅读论文的第一部分,论文作 ...
- 国际学术论文写作笔记01科学论文的构思、撰写与发表
论文写作就是将研究数据转变成科学知识 科学论文是记录原创性科学研究的结果(research article),或是综述已有科学发现及其发展(review),并将正式发表或出版的书写文件 科学论文,无要 ...
- [论文写作笔记] C4以小窥大的摘要 C5 讲故事一样的引言
文章目录 C4 以小窥大的摘要 4.1 摘要重要性 4.2 摘要要求及案例 4.3 结构化写作方法 Background(研究背景) Topic(研究话题) Methods(研究方法) Results ...
- 2篇word文档比较重复率_论文深耕 | 论文重复率太高怎么办?7个降重技巧收好了!...
Hello! 这是你与「大学生科研竞赛」的第 25 次相遇. 不知道从什么时候开始,我们的网络社区被各种关于论文降重.论文查重.论文改重的知识所包围.相信每个上了大学的朋友或多或少都会接触到这方面的内 ...
- web前端开发论文写作_外语论文文献引言格式—MLA Style
我们之前讨论了外语论文文献引用格式-APA Style和Chicago Style-芝加哥论文脚注引注格式,今天我们来介绍在Essay写作中如何使用APA格式引用文献.MLA格式是英文论文写作最常用的 ...
- SCI论文写作视频1.论文的三段式结构
导语: 本期,投必得学术邀请了堪萨斯州立大学刘子非教授为大家讲<论文的三段式结构>,本次讲座是视频推送的形式,分多期推送.欢迎大家观看和分享,如果您不想错过任何一期,请一定锁定投必得唯一官 ...
最新文章
- 以OpenGL/ES视角介绍gfx-hal(Vulkan) Framebuffer接口使用
- MyEclipse运行tomcat提示严重错误 严重: Error starting endpoint java.lang.Exception: Socket
- 【学习・求职必备】可谓是相当Awesomes了,这些综述类的github项目你不可错过!...
- 推荐大赛如何在一周时间内打进决赛
- Ubuntu上sublime配置nodejs运行环境
- 似乎是发现了asp.net ajaxToolkit中TAB控件的一个BUG
- (104)FPGA面试题-画出程序所描述的电路原理图(二)
- Unity3D基础7:Transform组件
- 使用Asp.net的TreeView来构建用户选择输入
- 基于单片机的表决器(七人)系统设计(#0496)
- 计算机无法访问苹果相册,iPhone与电脑连接后找不到照片怎么办?掌握这三个技巧,烦恼问题轻松解决!...
- Springboot中自定义文件映射
- 树莓派上串口TTL转RS485模块
- S3C2440 开发板实战(9):poll机制
- Apache Kudo: 1.0版和未来 [session]
- 英语软件那些好玩的功能你知道吗
- apicloud (第五篇 bmap百度地图一键回到当前位置)
- PTCMS仿蜻蜓听书在线小说听书网站源码修复版+手机版,内附安装教程
- 求助 android开发中 如果两个控件的id相同 会怎样?如何使用findviewbyid ()寻找到?
- Activiti的Hello World——请假流程
热门文章
- Linux虚拟机中vim编辑器常用命令介绍(一)
- pythoncharm设置翻译器_pyCharm 设置调试输出窗口中文显示方式(字符码转换)
- 软件项目组织与管理期末考试复习要点整理翻译
- adb for linux的工具包,adb工具包下载_adb工具包官方下载「最新版」-太平洋下载中心...
- ArcGIS10.4下载及安装
- EDA技术实用教程 | 复习四 | 标识符、关键字和规范的书写格式
- EDA技术实用教程VHDL篇--名词释义
- 数字电路课程设计--电子钟实验报告
- 华为 HG255D 刷openwrt trunk 支持ipv6
- Java Web 项目音乐网站的开发与实现