关注上方深度学习技术前沿”,选择“星标公众号”

资源干货,第一时间送达!

有时你遇到一篇古老的文献,PDF文档还是扫描版。又或者是遇到一幅网页版海报,上面的文字你完全看不懂。

但你无法把图片中的文字复制下来做进一步处理,是不是让人头大?

虽然市场上有很多OCR软件可以识别图片中的文字,但还是有种种局限性,比如无法识别文字排版,需要转成其他文件后才能处理,无法直接操作。

最近,一位来自MIT的学生Kevin Kwok解决了以上这些问题。他用计算机视觉算法写了个Chrome插件Naptha,可以直接识别网页图片中的文字,并直接对它们进行高亮、复制粘贴、翻译、修改等操作。

拾取图片中的文字

Naptha无需在电脑上安装App,直接在Chrome应用商店中搜索Project Naptha,就可以看到这款插件,一键安装后即可在Chrome浏览器中使用。

Naptha可以用于在线漫画、扫描文档,甚至连拍摄照片中的文字也能识别出来。

普通的网页文字自然不在话下:

如果是别人给你发过来的扫描文件也没关系,直接把文件拖到Chrome浏览器中(Chrome支持打开多种本地文件),Naptha就能识别。

对于照片中的图片,Naptha也能够读出。作者Kevin拍摄了一本书的封面,除了文字不清晰、竖向排列的情况,封面的书名和简介都能正常识别出来。

Naptha还支持读取表格文字,并将复制下来的文字粘贴到Excel里。

Kevin承诺,Naptha未来还会加入翻译、除去文字水印、直接在图片上修改文字等功能。这些功能目前还处在beta测试阶段,处于不稳定或者不可用状态。

不是OCR,是文本检测

光学字符识别(OCR)已经不是什么新鲜事了,虽然Naptha实现的功能看起来像OCR,但实际上它主要功能实际上是文本检测。

一般的OCR不包含语言模型,而Naptha则可以根据上下文的概率输出一系列字母。比如把一串字符判定成“hello”,而不是“he1 | o”。

OCR需要知道图片中的语言才能正确识别文本,Naptha使用的是一种称为“ 笔划宽度变换”的算法,该算法由微软研究院于2008年提出,它就像人一样,即使不知道是何种语言,也能猜到文字就在那里。

结合其他算法,如连通分量分析(识别不同的字母)、otsu阈值(确定字间距)、不相交的集合森林(识别文本行),Naptha可以非常快速地建立文本区域、单词和字母的模型,识别图中存在哪些特定字母。

通过一些基本的布局分析和文本度量,Naptha还可以找出文本的对齐参数、字体大小和字体粗细。有了这些信息,它可以在同一个地方以类似的字体重新打印文本,或者将文本改成同字体的其他文字。

传送门

博客地址:
https://projectnaptha.com/

Chrome插件下载地址:
https://chrome.google.com/webstore/detail/project-naptha/molncoemjfmpgdkbdlbjmhlcgniigdnf

MIT开发的一款最新Chrome插件,功能远超OCR软件,可快速识别和复制图中文字相关推荐

  1. 能直接复制图片中文字,功能远超普通OCR软件,MIT学生开发了一款强大Chrome插件...

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 有时你遇到一篇古老的文献,PDF文档还是扫描版.又或者是遇到一幅网页版海报,上面的文字你完全看不懂. 但你无法把图片中的文字复制下来做进一 ...

  2. c多语言开发,“手把手”教你开发一个多语言翻译chrome插件

    多语言互译chrome插件 最近逛掘金看了下,前端必备技能项竟然有"chrome插件开发",想想了自己的英语功力(开机自启动"有道翻译"-哈哈哈),于是,话不多 ...

  3. [分享] 【强烈推荐】要速度更要方便!75款实用Chrome插件推荐

    <卡饭月刊>第28期发布(2011.07) 本帖最后由 lmylyl 于 2011-9-4 22:24 编辑 时下很多人都用上了Google Chrome浏览器,这款目前世界上最快的浏览器 ...

  4. 65款实用Chrome插件推荐

    时下很多人都用上了Google Chrome浏览器,这款目前世界上最快的浏览器既简洁又高效,用来上网冲浪还真是不错.不过好马也得配好鞍,和很多非IE核心浏览器一样,Chrome也需要利用插件扩展自己的 ...

  5. 基于uni-app开发的一款视频播放器插件

    yy-video-player 基于uni-app开发的一款视频播放器插件,开箱即用,具有视频下载,页面返回,弹幕,进度条等功能. 插件地址:https://ext.dcloud.net.cn/plu ...

  6. 5款知乎高赞的超牛软件,你一定要知道

    你的电脑上有哪些宝藏实用软件?今天来给大家分享5款知乎高赞的超牛软件,你一定要知道! 先收藏后评论!良心单品多多! Notion Notion是一款老牌的高质量个人知识管理软件. 它高效地帮助用户安排 ...

  7. 要速度更要方便!20款实用Chrome插件推荐

    上次为大家推荐了10款Chrome 4.0插件,今天我们再次精心挑选了20款实用插件,感兴趣的不妨慢慢往下看吧!(注:本文所有插件均已在Google Chrome 4.0.249.78 + Windo ...

  8. 前端开发和设计必备的Chrome插件

    Web设计.开发.调试工具集 Google Chrome是最好用的几个浏览器之一,自从2011年11月份赶超Firefox之后,已成为当今互联网的主流浏览器.今天,我来分享下自己收集的一系列Chrom ...

  9. 【Chrome浏览器插件开发】浏览器插件运行机制02之实战开发出一款Google浏览器插件——含源码全部过程 (建议在Linux环境下)

    一.浏览器插件配置文件 manifest.json入门 每个浏览器插件都有一个 JSON 格式的文件,叫做 manifest.json,里面提供了插件的描述信息. manifest.json 文件本质 ...

最新文章

  1. 机器学习在热门微博推荐中的应用
  2. 被动路由跟踪工具InTrace
  3. 子组件获取父组件的值,将这个值作为状态值保存
  4. pytorch 常用的 loss function
  5. 《Go语言圣经》学习笔记 第四章 复合数据类型
  6. CentOS学习笔记--程序管理
  7. 【转】谈谈c#中异步编程模型的变迁**
  8. 翁同龢后人向上海博物馆捐赠两件重要家藏
  9. html5文本超过指定行数隐藏显示省略号
  10. java类型之间的转换_JAVA基本数据类型及之间的转换
  11. Scribe+HDFS日志收集系统安装方法
  12. Mysql 删除数据表的三种方式详解
  13. 算法详解_【MOT】详解SORT与卡尔曼滤波算法
  14. python中文文本聚类_python进行中文文本聚类实例(TFIDF计算、词袋构建)
  15. 小杯子微信多开 双开共存版 ios8.0微信版本6.0免费获取了
  16. ignore的音标_单词ignore的音标_词典解释_翻译_相关例句_一直查
  17. php 通过ip获取省份,通过IP获取用户地理位置省份城市的接口使用
  18. php怎么接入微支付宝支付,php 微信公众号接入支付宝支付
  19. 给大家安利一个Python版本的记忆翻牌小游戏!上才艺!!
  20. ../和./和/的区别

热门文章

  1. Winform分页控件之纯分页显示处理
  2. mysql当前时间减1小时_最佳睡眠时间:晚上睡眠不超8小时,午睡不超1小时
  3. python访问数据库如何解决高并发_怎样解决数据库高并发的问题
  4. springboot输出hello world_Spring Boot 入门教程 | 图文讲解
  5. .condarc文件是什么
  6. tomcat环境变量参数catalina.home和catalina.base的设置位置
  7. 隐马尔科夫模型(HMM)解释 和 前向与后向算法[转] 讲解通俗易懂 赞
  8. Pandas:透视表(pivotTab)和交叉表(crossTab)
  9. torch.nn.module API
  10. torch.nn.BCELoss用法