java字节流——简单实现论文查重功能
首先可以在目录下创建几个txt文件,如图,一个作为论文,几个作为论文库:
其中论文中包含论文库中的内容,现在在论文里放一句论文库中的句子
package com.oracle.core;import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;public class Check
{public static void main(String[] args) throws IOException{int count=0;//获取到论文的信息File file=new File("D:\\JAVA\\论文\\论文.txt");InputStream in=new FileInputStream(file);byte[] b=new byte[in.available()];in.read(b);String paper=new String(b,"GBK");//获取论文库的信息File dir=new File("D:\\JAVA\\论文\\论文");File[] listFiles = dir.listFiles();for(int i=0;i<listFiles.length;i++){File f=listFiles[i];InputStream in1=new FileInputStream(f);byte[] b1=new byte[in1.available()];in1.read(b1);String papers=new String(b1,"GBK");if(papers.contains(paper)){System.out.println(f.getName()+"存在重复内容");count++;}}System.out.println(count);}}
运行结果:
其中所有的文件保存编码为ANSI,代码中读取编码为GBK,否则会出现乱码的情况,程序会输出为0。
每一个汉字 都有对应的一个编码
GBK 常用汉字编码
GB2312 所有汉字编码 是GBK的扩充
UTF-8 万国码 默认的编码格式
不同的文字要用不同的编码去解析它
java字节流——简单实现论文查重功能相关推荐
- 有什么好的论文查重软件?两分钟让你知道
在我们的大学的学习中,相信大多数的小伙伴都需要写毕业论文,而每个人的毕业设计论文研究都是要经过查重检测的,当你论文的重复率过高的话,那么对于毕业也就会有一定的影响.所以我们就可以提前做好论文查重的工作 ...
- 本科论文查重网站分享
本科论文查重网站分享 本科论文需要查重,很多人都知道.知网作为查重届的权威代表,翟天临博士却不知道知网是什么,于是学历造假最终被发现.本文主角不是翟"博士",而是和知网一样有论文查 ...
- (精品)JAVA SSM框架黄淮学院食堂仓库管理系统的设计与实现源码+论文+查重报告+效果、安装视频+ppt模板(已降重)
项目介绍: (精品)JAVA SSM框架黄淮学院食堂仓库管理系统的设计与实现源码+论文+查重报告+效果.安装视频+ppt模板(已降重) 高清视频演示: https://www.bilibili.com ...
- 计算机类的毕业论文是怎么查重的,论文检测软件是如何实现查重功能的
之所以人们在写完论文之后会使用知网检测软件来检测文章的原创度,是因为重复率过高的论文是无法符合要求的.那么,我们日常生活中所使用的论文检测软件是如何实现查重功能的呢?现在,就让我详细的为大家进行介绍. ...
- Java实现论文查重系统
1.论文查重系统背景 日常生活中投票是非常常见的一件事,随着现在科技的发展,电子投票都是以线上操作的形势完成,本系统为模仿电子投票系统所作. a.本系统有管理员登录,个人信息修改,用户管理,投票管理, ...
- 目前需要开发出一个功能,对比查找并标注出两篇文章中类似的段落或者词句,有什么开源项目有这个功能吗? 其实有点像论文查重的功能,有论文查重的比较通用的开源项目推荐吗?...
是的,你可以使用论文查重的工具来对比查找并标注两篇文章之间的相似段落或词句. 你可以尝试使用这些开源项目: MOSS (Measure Of Software Similarity):这是一个用于检测 ...
- lucene配置动态域_学位论文查重中如何使用Lucene全文检索
本系统用的是Lucene全文检索架构,Lucene作为一个全文检索引擎框架,在构建机制上有众多明显的优点:首先,它可以对任何可以转化成文本格式的数据进行索引的创建,而学术论文包含的doc.PDF和CA ...
- ChatGPT直出1.5w字论文查重率才30% - 基于物联网技术的智能家居控制系统设计与实现
文章目录 ChatGPT直出1.5w字论文查重率才30% - 基于物联网技术的智能家居控制系统设计与实现 一.绪论 1.1 研究背景与意义 1.2 国内外研究现状分析 1.3 研究内容与目标 1.4 ...
- 关于论文查重相关问题
论文查重定义 论文查重即查论文重复率(文字复制比),是高校对学术不端文献的检测,目前大部分高校采用中国知网CNKI学位论文检测系统TMLC/VIP进行论文查重工作.知网查重时,绿色表示合格,黄色的文字 ...
- 分享一个靠谱的免费论文查重网站
给大家分享一个靠谱的免费论文查重网站PaperPP:http://www.paperpp.com,可以一站解决"论文查重.改重.降重"等问题@TOC 欢迎使用Markdown编辑器 ...
最新文章
- 大年初三,过年期间最让你受不了的习俗有哪些?
- 盘点2019年336起机器人及相关领域投融资事件!注重细分领域深耕行业复苏趋势显现...
- 0.11内核rd_load@ramdisk.c中memcpy函数好像有bug
- linux中 probe函数的何时调用的?
- android 看AP 国家代码,Android WiFi 获取国家码
- Linux文件夹含义
- osgQt::GLWidget的坑
- “一边熬夜一边求不要猝死”,90后养生朋克指南,条条扎心!
- finditerable 转list_java – 通过拆分和运行将ListenableFuture转换为Iterable
- sqlserver约束
- 147. class_exists()
- 5月深度学习班第8课rnn_appliacation
- 多线激光雷达遇到的问题
- 计算机网络hdcp是什么意思,HDCP技术_百科..doc
- Assembler - Debug
- Ubuntu安装teamviewer12
- C++20 实现字符串类型的转换操作
- 【6G】基于 Dyncast 的算力网络架构
- (原)python中matplotlib的颜色及线条控制
- 使用chat-gpt 最新最快方法
热门文章
- 《东周列国志》第五回 宠虢公周郑交质 助卫逆鲁宋兴兵
- HTTP认证与https简介
- BZOJ 2751: [HAOI2012]容易题(easy)( )
- 详解线上线下收单业务(一)第三方支付
- [离散数学]命题逻辑P_2:命题联结词
- 在华为做测试员是一种什么体验?带你深入了解华为
- NHibernate之旅(9):探索父子关系(一对多关系)
- 神经网络计算棒怎么用,英特尔神经计算棒拆解
- 性能测试----测试执行
- 分析 OVS 如何实现 vlan 隔离 - 每天5分钟玩转 OpenStack(140)