TODO

-[ ] 处理不同时区,时间格式不同的邮件,当前代码无法处理不同时间格式的邮件,

一旦出现格式与所检测格式不同的邮件,Celery就会崩溃

-[ ] 设计一个更好的查重算法

-[ ] 在一次下载邮件的过程中,如果已经下载了的话,在Celery未重启的情况下再次下载,会出现错误

-[ ] 在helper模块中将发件学生的Email和attachments用dict联系起来,保存到redis中

(一对多映射,还要解决attachment名称的更新问题 )

-[ ] 在在线批阅模式中以网页嵌入PDF的方式实现,预设的模式是页面左侧是pdf文件,右侧是评分模块和查重的一些信息

-[ ] 文件上上传的时候上传JPG就会为None,不知道为啥

DONE

-[x] 附件名符合规格,在限制时间之内的邮件的下载

-[x] word内容的提取

-[x] 查重结果的导出

开发过程中用到的资料

各大免费邮箱提供的POP3,SMTP,IMAP地址

编写收发邮件模块参考的资料

编写前端文件上传代码时参考的资料

学习过程中发现官网的Demo并不是可以直接拿来用的,需要做修改

这个Demo也存在问题,比如不能上传JPG文件,前端上传的过程中提取不到文件名,会是一个空值,猜测可能是组件内部屏蔽或者代码里未设置好

注意事项

邮箱列表中的第一个邮件的编号是1

python文本查重_GitHub - LiuYinCarl/check_homework: 文本查重工具相关推荐

  1. 【NLP】Python实例:基于文本相似度对申报项目进行查重设计

    Python实例:申报项目查重系统设计与实现 作者:白宁超 2017年5月18日17:51:37 摘要:关于查重系统很多人并不陌生,无论本科还是硕博毕业都不可避免涉及论文查重问题,这也对学术不正之风起 ...

  2. python 手把手教你基于搜索引擎实现文章查重

    前言 文章抄袭在互联网中普遍存在,很多博主都收受其烦.近几年随着互联网的发展,抄袭等不道德行为在互联网上愈演愈烈,甚至复制.黏贴后发布标原创屡见不鲜,部分抄袭后的文章甚至标记了一些联系方式从而使读者获 ...

  3. PyQt(Python+Qt)学习随笔:纯文本编辑器QPlainTextEdit功能详解

    专栏:Python基础教程目录 专栏:使用PyQt开发图形界面Python应用 专栏:PyQt入门学习 老猿Python博文目录 一.概述 QPlainTextEdit是用于纯文本的一个高级文档编辑器 ...

  4. python计算特征的统计值并文本输出

    python计算特征的统计值并文本输出 # 输出统计分位数 df.describe(percentiles=[0.05, 0.25, 0.5, 0.75, 0.95]) featname:A => ...

  5. 机器学习算法Python实现:基于情感词典的文本情感分析

    # -*- coding:utf-8 -* #本代码是在jupyter notebook上实现,author:huzhifei, create time:2018/8/14 #本脚本主要实现了基于py ...

  6. python查找并修改文件中的内容_如何使用Python搜索和替换文件中的文本?

    如何使用Python搜索和替换文件中的文本? 如何使用Python 3搜索和替换文件中的文本? 这是我的代码:import osimport sysimport fileinputprint (&qu ...

  7. python 写txt 换行_写入txt文本的内容为什么没换行效果?

    PHP把内容写入文件,并每次自动换行 weixin_4089680029712018-07-20 Java文本追加.换行.输出到TXT u01422837514692015-12-15 Android ...

  8. OpenAI的GPT-2:用Python构建世界上最先进的文本生成器的简单指南

    介绍 "The world's best economies are directly linked to a culture of encouragement and positive f ...

  9. python数据获取与文本分析_python文本分析之处理和理解文本

    前言: 在进行自然语言的建模(NLP)时,我们通常难以处理文字类型的数据,因此在常见的机器学习项目中,数据的格式是结构化的,就算在视觉处理的时候也是一个矩阵或者高维张量的形式.那么文字类型的数据我们应 ...

  10. Python一字一字的显示文本内容

    前面一段时间朋友问我怎样用Python写一段代码,让文本内容一个字一个字的显示,这个当然是可以实现的了,我们可以先看看效果.视频没法上传,只能大家自己运行代码了. 程序很简单,几行代码就可以了,当然想 ...

最新文章

  1. c与python的区别-c语言和python的区别是什么
  2. 【Paper】2021_Analysis of the Consensus Protocol of Heterogeneous Agents with Time-Delays
  3. 蓝牙nrf52832的架构
  4. CRC32爆破解密脚本工具(三)
  5. sql server解析xml属性为表格_[Mybatis][基础支持层]mapper xml sql 解析
  6. 解决Ubuntu下软件包依赖关系的若干方法
  7. python软件下载安装百度网盘-Python自动化测试视频教程【百度云盘下载】
  8. 小心中中国移动“短号集群网”的招
  9. 微信支付开发(1) JS API支付V3版(转)
  10. C# BackgroundWorker的使用 转
  11. java之模块学习-JAVA的IO流
  12. c语言读写txt坐标文件数据,C语言——从txt文件中读写数据
  13. java面试题库app
  14. 面试官:如何进行 JVM 调优(附真实案例)
  15. 一键修改手机DNS的bat文件
  16. Gitlab与Jenkins构建CICD环境
  17. 程序员除了代码还应该有什么
  18. 虚幻引擎_矢量场初探
  19. 功放、音响、耳机、播放器试音歌曲,说不定你会喜欢
  20. 线性回归模型预测利润

热门文章

  1. Matlab图像的二维傅里叶变换频谱图特点研究
  2. 微型计算机系统的层次关系图,1.2 计算机系统层次结构
  3. 2020年注册电气工程师基础考试大纲:专业基础(供配电、发输变电相同)
  4. BT5 autoscan genlist ADMsnmp snmpcheck使用
  5. D触发器实现JK触发器
  6. UE 编辑器无法保存文件(图表被连接到外部包中的私有对象)
  7. 如何在php中添加音乐播放器,音乐播放器的制作实例(html5)-
  8. html语言弹出窗口代码,网页弹出窗口代码
  9. 微信小程序实时音视频功能简析(live-pusher与live-player)
  10. 小电托——1-1磁路的基本概念和基本定律