来源:中国青年报

编辑:学妹

人工核查核酸报告费时费力又易出错,怎么办?

4月7日,复旦大学官微发文,自三月初以来,学校启动常态化核酸筛查工作,要求班级辅导员必须核查学生“健康云”核酸完成截图,确保“不漏一人”。

学校信息科学与工程学院博士生李小康的操作火了,几分钟就能快速核查数百人的核酸完成截图,大大提高核查效率和精度

从1小时到2分钟,一串代码搞定

据了解,李小康目前担任学院2019级信息1班辅导员。

对于核查核酸报告的工作,他表示:“听起来好像很简单,但实际做的时候,一个班级的截图可能就需要花上半小时核查,如果是人数多的院系可能需要更久,还可能会看错看漏。”

李小康正在做志愿者

作为生物医学工程专业博士生,他的研究方向是医学影像与人工智能,平常会接触很多图像处理方法。李小康第一时间想到以前学到过的OCR (Optical Character Recognition,光学字符识别)技术。

“OCR可以把图像中的文字识别出来,转换为文本信息,就方便用来核查了。而且因为核酸截图是打印字体,识别率非常高,几乎可以做到100%准确。”

他还想到了Python语言中的正则表达式——可以搜索到字符串中的特定模式内容。

“使用正则表达式就可以把想要的信息从OCR识别的文本中筛选出来。最后,确认好每张截图里的姓名、检测时间和是否已采样等信息后,再把所有人的结果输出到Excel文件中,方便人工确认。”

最后,李小康确定了“OCR文字识别+正则表达式筛选”的程序思路。3月15日晚,他花了一个多小时就写出了初始代码,共130行,发现确实能够跑通,且运行效率很高。

李小康最初写程序时和学工同事的聊天

程序一写好,李小康就在自己班级的核酸截图数据上进行验证,准确率果然很高,甚至检测出了之前人工核查没有发现的问题。并且,程序运行时间很短,80多张图只需要20多秒。

复旦大学:有望全校覆盖

目前,程序已在该学院服务2周。李小康曾让别的老师试用自己的程序进行核查。800幅截图,原来要几个人核对一个多小时,现在只需等2分钟就拿到结果。

他把这件事发到朋友圈之后,不少同事表示很感兴趣,他还把代码分享了出去。为了方便不会编程的老师使用,李小康最后还把程序进行了封装——用的时候,只要在命令行输入一行代码就可以运行。

程序输出的Excel文件

据了解,学校信息办也与李小康对接。预计在不久的将来,师生们就可不用再手动收集核酸截图,而是通过小程序直接上传图片,可在后台随时查看统计结果。

今天下午,中国青年报记者试图与李小康取得联系时,他正在学校楼栋担任志愿者送饭。

他说过:“原理也很简单,只要是会写代码的人第一时间就会明白是怎么回事,但是不做相关工作的感受不到这件事情的费时费力,自然也不会想出办法。我只是用我学到的知识解决实际工作中的困难。”

用所学贡献青春力量!

为李小康点赞

往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

【Python】核酸结果统计难?复旦博士生的操作火了......相关推荐

  1. 核酸结果统计难?130行代码实现基于ocr的核酸截图识别存储Excel(复现代码核查核酸报告)

    来源: 核酸结果统计难?复旦博士生的操作火了https://m.gmw.cn/baijia/2022-04/08/35644611.html 1 程序背景 学校要收核酸截图,汇总太麻烦了,故将OCR整 ...

  2. python人工智能算法很难_为什么AI很火,但是落地很难?

    人工智能(AI)技术在产业当代化的海潮下向各个平台分泌,包含市政.交通.医疗.商用等,跟着5G商用的东风,现在AI技术更火了,不过朋友们能够都有发掘,AI固然很火,但真确落地很难,这是为何呢? 会导致 ...

  3. 从复旦博士生到985高校副教授,贫穷使人深知摆脱自卑的艰难

    本文来源:<读者>杂志 作者:黄振乾 昨天往中国银行的固定账户存入400人民币.至此,还清了本科时候的国家助学贷款,加利息一共28000元.六年.但就是这么点小钱,折腾了我这么多年.我想写 ...

  4. python使用正则表达式统计字符串中出现次数最多的数字

    python使用正则表达式统计字符串中出现次数最多的数字 #python使用正则表达式统计字符串中出现次数最多的数字 # find the most occurring element import ...

  5. python 框架好学吗-python的flask框架难学吗

    Flask框架难学吗?它和Django哪个更容易一些,这可能是学Python web开发的同学经常问的问题,下面来说一下flask框架. Flask是python的web框架,最大的特征是轻便,让开发 ...

  6. python 英语词频统计软件_Python数据挖掘——文本分析

    作者 | zhouyue65 来源 | 君泉计量 文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程. 一.语料库(Corpus) 语料库是我们要分析的所有文档的集合. ...

  7. 会python学php难吗_会python再学php难吗

    会python再学php难吗?当然不会难!首先语言都是想通的,只是语法的区别,而且PHP入门简单,即便是零基础的小白入门也不会有太大的压力,更何况已经有编程基础了,上手PHP会更快! 推荐:<P ...

  8. python创建类统计属性_轻松创建统计数据的Python包

    python创建类统计属性 介绍 (Introduction) Sometimes you may need a distribution figure for your slide or class ...

  9. 用python统计图片中的点_用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)...

    我就废话不多说了,大家还是直接看代码吧! import PIL.Image import numpy import os import shutil def sum_right(path): img ...

最新文章

  1. R语言do.call函数和call函数实战
  2. 一图看清全球270家典型区块链服务商
  3. cn域名注册国外_国内cn域名注册量超com域名,“com”时代结束了吗?
  4. wegame饥荒一直连接中_23万人捧场热血传奇怀旧版,WeGame拯救计划,前景如何?...
  5. 倒排索引(Inverted File Index )
  6. 分布式集群环境下,如何实现session共享三(环境搭建)
  7. Asp.Net 4.0 新特性 系列 之一 从页面标记%%说起
  8. 六自由度机械臂仿真设计|包括UR5|Puma|victor5|运动学正逆解介绍|MATLAB机器人工具箱|Adams仿真
  9. excel英文大小写转换
  10. 湖南工业大学计算机学院有哪些社团,湖南工业大学学生社团联合会
  11. H5设备运动事件 DeviceMotionEvent 实现摇一摇功能
  12. matplotlib命令与格式:系统字体与显示中文
  13. 系统安全性之十大措施
  14. 【关于听任大佬的讲话的深刻感悟】
  15. NFT 是如何在 2021 年造就 400 亿美元市场的?
  16. uva10935卡片游戏
  17. 数据中心服务器机柜安装,简单几步教你改善数据中心机柜布线
  18. pytorch入门笔记
  19. 蓝光发展两度出售优质资产,加速资金回笼背后,只剩“无奈”二字
  20. Azure 深入浅出[3]: 如何在MS Visio里面画专业的Azure技术架构图?

热门文章

  1. 20170804 - 今日技能封装 - Q
  2. js获取网页面的高度和宽度
  3. MySQL --log-slave-updates
  4. SQL Server:移动系统数据库
  5. suoi46 最大和和 (线段树)
  6. 【整洁之道】如何写出更整洁的代码(上)
  7. MyBatis笔记——EhCache二级缓存
  8. [小北De编程手记] : Lesson 05 玩转 xUnit.Net 之 从Assert谈UT框架实践
  9. VSTO之旅系列(三):自定义Excel UI
  10. 创新式开发探索(一) —— 开篇