XINCHECK SDK是一个提供了文本查重引擎和文本查重算法的java包,使用它可以快速开发涉及文本查重相关的功能。比如标书查重、论文查重、文档查重、作业查重之类的。
也有基于这个sdk开发的桌面端软件,我这边也进行了试用。可以看这个链接XINCheck桌面端使用介绍
好了废话不多说,下面简单介绍一下SDK的使用方式

一、引入查重SDK

通过maven将本SDK 0.5.0版本引入到项目中

XINCHECK SDK需要使用1.8.0_151及以上版本的JDK,如JDK低于此版本,需要修改JDK加密策略文件或升级JDK。

SDK存放在私有maven仓库中,需要先在<repositories>中添加以下仓库

<repository><id>XINCHECK</id><name>XINCHECK Public Repository</name><url>https://maven.xincheck.com/repository/maven-releases/</url>
</repository>

然后在<dependencies>中添加依赖

<dependency><groupId>com.xincheck</groupId><artifactId>duplicate-check</artifactId><version>0.5.7</version>
</dependency>

除maven外同样支持Gradle、lvy等,修改对应引入语法即可。

二、授权SDK

非商业用户可以申请免费的许可证,需要先调用下面的方法获取并打印服务器或PC机的机器指纹

System.out.println(CheckManager.INSTANCE.getMachineCode());

访问获取免费版授权页面获取授权许可证
然后再拿获取到的免费授权对SDK进行授权

CheckManager.INSTANCE.setRegCode("授权许可证");

三、使用简易启动器开始查重

SDK内置了简易启动器EasyStarter,一行代码即可完成SDK调用。参数介绍如下
参数1:待查文件所在的文件夹路径(如果待查文件只有一个,可以传文件路径);
参数2:比对库文件所在的文件夹路径(如果比对库中只有一个文件,可以传文件路径);
参数3:保存查重报告的文件夹路径。如果不需要导出查重报告可以传空字符串;
参数4:白名单文本。对于标书查重等场景,有一些文本是允许重复的,这些文本可以通过该参数传入。该参数可选,如不需要可以不传或传null。

List<Reporter> reporters = EasyStarter.check(new File("参数1"), new File("参数2"), "参数3", "参数4");

横向查重应用场景下参数1和参数2可以相同,相同的文件会自动跳过比对,不会出现重复率100%的问题。除示例方法外,该方法还有多个重载,具体可以自行了解,如需详细了解。
完整示例代码可参见GitHub链接中的EasyStart部分。

四、查重结果

查重完毕后可以保存如下样式的html查重报告,部分样式可以通过接口自定义:



五、详细开发文档

EasyStarter只适用于逻辑简单、数据量少、无异步执行需求的应用场景,其中大量参数使用了默认值。实际项目开发过程中,对于复杂的应用场景,可以查阅完整的开发者接入文档,使用原生方式进行调用:开发者接入文档

五、付费?

XINCheck有付费版本可以购买,具体价格参加它的网站上的报价表。不过个人使用的话其实使用免费版就足够了,虽然免费版只支持8000字以下下的文本查重,但是超过8000字的可以拆分成多个文件进行查重也是一样的。报价表链接。

使用XINCheck SDK开发查重系统相关推荐

  1. [附源码]计算机毕业设计Python作业查重系统(程序+源码+LW文档)

    该项目含有源码.文档.程序.数据库.配套开发软件.软件安装教程 项目运行 环境配置: Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+N ...

  2. Java实现论文查重系统

    1.论文查重系统背景 日常生活中投票是非常常见的一件事,随着现在科技的发展,电子投票都是以线上操作的形势完成,本系统为模仿电子投票系统所作. a.本系统有管理员登录,个人信息修改,用户管理,投票管理, ...

  3. 基于Python的作业查重系统的设计和实现

    <基于Python的作业查重系统的设计和实现>该项目采用技术Python的django框架.mysql数据库,项目含有源码.论文.PPT.配套开发软件.软件安装教程.项目发布教程.核心代码 ...

  4. 论文查重系统可以检测哪几种语言?

    很多 论文查重系统 都是支持中文查重的,并且有一部分系统的查重结果是非常准确的,那么论文查重系统到底支持几种不同语言的检测呢?如果不是中文论文是英文论文的话,是否能检测出论文重复率? 有的论文查重平台 ...

  5. 基于Python实现的作业查重系统

    <基于Python的作业查重系统的设计和实现>该项目采用技术Python的django框架.mysql数据库 ,项目含有源码.论文.PPT.配套开发软件.软件安装教程.项目发布教程.核心代 ...

  6. [附源码]计算机毕业设计基于Springboot作业查重系统

    项目运行 环境配置: Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclis ...

  7. 论文查重系统有假的吗

    在这个世界上,还真的没有什么东西是人无法模仿的,因为论文查重系统本身就是人开发的,所以说换另一群同样拥有这项技能的人,也能够开发出一样的系统.只不过可能前者拥有自己的知识产权,而后者只能是偷偷摸摸的进 ...

  8. 基于python的查重系统_答案在这!如何快速的通过论文查重检测?

    想必同学们都知道,所谓的论文查重是使用论文查重系统软件来进行论文检测的.大部分的高校基本上是采用知网查重系统,在进行论文查重之前,我们有必要先了解一下论文查重的相关知识点.了解清楚之后,我们再进行论文 ...

  9. opencv图像配准_Milvus 实战 | 基于 Milvus 的图像查重系统

    背景介绍 由于巨大的利益,论文造假屡见不鲜,在部分国家或地区甚至形成了论文造假的产业链.目前大部分论文查重系统只能检查论文文字,不能检查图片.因此,论文图片查重已然成为了学术论文原创性检测的重要部分. ...

最新文章

  1. noj数据结构稀疏矩阵的加法十字链表_一个算法毁了一款好游戏?算法和数据结构到底有多重要?...
  2. 介绍一个好用的抓取dump的工具-ProcDump
  3. 曼哈顿距离(坐标投影距离之和)d(i,j)=|X1-X2|+|Y1-Y2|.
  4. 20210625 函数的极限
  5. spring+cxf调用webservice接口
  6. python获取局域网内的设备_python调用nmap探测局域网设备
  7. rds for mysql的监控指标_mysql(RDS)常用性能指标监控
  8. 飞鸽传书2011绿色版使用简介
  9. CentOS上安装Jekins
  10. 快速定位网络故障步骤
  11. 移动通信原理B-------课后作业1
  12. 制作pdf文档书签,自动生成or根据目录生成
  13. DHCPv6技术介绍
  14. webview造成窗体泄漏
  15. 企查查网站信息爬取1.0版
  16. crm客户关系管理系统总结
  17. start-all.sh启动设置ssh免密登陆还总是提示输入密码的解决办法
  18. 18、VXLAN技术介绍与应用场景,附VXLAN手册下载
  19. min-height和min-width的使用场景
  20. windows7 64位使用U盘进行系统安装

热门文章

  1. Jvisualvm监控远程weblogic服务
  2. 计算机文件共享xp,两台XP怎么共享文件
  3. 强化学习(二):马尔可夫决策过程
  4. Unity3d简单的发牌效果
  5. Arduino ESP32 SD卡读写实例
  6. 安卓终端神器Termux (后面还有Termux常用的快捷键,妥妥干货分享,记得点赞收藏哦!)
  7. ONE一言每天一句名言API
  8. 空间三角形_如何改造三角形小屋,营造舒适空间?
  9. 2022 年最新版 68 道 Redis 面试题,20000 字,赶紧收藏起来备用
  10. 《南朝凶猛》 轩辕鸿鸣