在ubuntu20.10系统下实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴
目的:因为最近主要使用ubuntu系统,想要将视频中的文字提取出来,实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴.
主要思路
利用截图软件gnome-screenshot 进行截取需要被文字识别的图片;
利用文字识别OCR软件tesseract,进行识别
将结果输出,复制到文件和剪切板
步骤1:安装依赖软件
安装tesseract
tesseract是一个开源的OCR引擎,最初是由惠普公司开发用来作为其平板扫描仪的OCR引擎,2005年惠普将其开源出来,之后google接手负责维护。目前稳定的版本是3.0。4.0版本加入了基于LSTM的神经网络技术,中文字符识别准确率有所提高。
添加源
sudo add-apt-repository ppa:alex-p/tesseract-ocr
更新源
sudo apt-get update
安装
sudo apt-get install tesseract-ocr
安装中文字库
tesseract支持60多种语言的识别不同,使用之前需要先下载对应语言的字库,下载地址:https://github.com/tesseract-ocr/tessd
在ubuntu20.10系统下实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴相关推荐
- Ubuntu20.10系统FreeCAD 0.19编译安装
Ubuntu20.10系统FreeCAD 0.19编译安装 济南友泉软件有限公司 零.系统环境 root@test-HVM-domU:~# lsb_release -a No LSB modules ...
- Ubuntu20.4系统下安装kvm并创建虚拟机
Ubuntu20.4系统下安装kvm并创建虚拟机 一.安装Ubuntu20.4系统 二.在Ubuntu20.4系统下安装KVM 三.kvm虚拟机及其磁盘映像文件(CentOS 7.9)制作 一.安装U ...
- 目标检测第5步:如何在Windows 10系统下,搭建YOLOv5(5.0)环境?保姆级,没有人比这个更详细了(更新时间2022.3.22)
(请先看置顶博文)本博打开方式!!!请详读!!!请详读!!!请详读!!!_Cat-CSDN博客 目录 一.安装Anaconda或Miniconda 二.安装CUDA 三.安装cuDNN 四.安装Pyt ...
- linux添加HP网络打印机,在Ubuntu 18.10系统下安装HP网络打印机的方法
本文介绍在Ubuntu 18.10系统下安装HP网络打印机的方法,只需要四个步骤就可以了.同样的方法也适合在Ubuntu 18.04系统下. 背景 最近做了个双系统Windows+Ubuntu 18. ...
- 【Ubuntu系列】Ubuntu20.04系统下3060显卡驱动安装记录
[Ubuntu系列]Ubuntu20.04系统下3060显卡驱动安装记录 设备及相关信息简介 具体安装步骤 step1 获取显卡硬件信息 step2 在Ubuntu系统中卸载显卡驱动 step3 安装 ...
- Win 10 系统下搭建 Python 编程环境,有手就行
前言 想把一门编程语言学好,会搭建编程环境无疑是有必要的,纵然有线上集成的编程环境,但那高度依赖于网络条件以及诸多情况,这使得我们在编程的时候难以存储自己的资料. 学习和使用 python 一年多以来 ...
- Windows 10系统下查看硬盘类型的方法
本文主要介绍在 Windows 10 系统下,通过 Windows PowerShell 查看硬盘类型的方法. 通过快捷键"Win+S"打开搜索框,输入"Windows ...
- Macbook windows 10系统下录屏软件无法录制系统声音的问题
Macbook Windows 10系统下录屏软件无法录制系统声音的问题 问题原因 Virtual Audio Cable 下载与安装 以Obs-Studio为例进行测试 录屏完成 参考教程链接 问题 ...
- Windows 10系统下哪些服务可以关闭?
Windows 10系统下哪些服务可以关闭? Windows 10系统中很多服务和进程其实大家在平时都用不上,这些服务和进程不仅占用了很大部分的资源,而且还会影响系统的运行速度和安全.我们可以关闭那些 ...
最新文章
- 一年结构转换,陌陌走向稳健盈利,唐岩没有放手理由
- File类的构造方法
- 动态卡片:富媒体内容井喷式增长下,新一代移动端动态研发的模式
- Saying Good-bye to Cambridge Again --by Xu Zhimo
- 【论文复现】Hierarchical Attention Networks for Document Classification
- 洛谷——P1319 压缩技术
- python cnn模型_CNN系列模型发展简述(附github代码——已全部跑通)
- 拓端tecdat|Python贝叶斯回归分析住房负担能力数据集
- 德鲁克谈《自我管理》——《哈佛商业评论》史上最受欢迎的文章
- Unity 回合制战斗系统(中级篇)-血条和伤害数值
- 多媒体的计算机系统,多媒体计算机系统().PPT
- asp.net 引入html文件路径问题,asp.net 网站获取一个文件或文件夹的绝对路径,使用方法Server.MapPath(项目根目下虚拟文件路径)实现...
- 软件工程——经验软件工程概述
- nginx 上传文件大小限制
- matlab和通达信,通达信dllmatlab
- discord验证无法通过_如何通过Discord的“上线”直播
- 蓝桥杯题目练习(JAM计数法)
- 百度SEO比蜘蛛池还强大的推送工具收录宝
- CSP 201903-1 大中小
- java 自定义错误代码_Java 自定义异常(转载)
热门文章
- 【吴刚】UI拟物图标设计初级入门标准教程-吴刚-专题视频课程
- 如何在腾讯会议中使用PPT使用演讲者模式
- [转载]服务数据对象简介
- linux编译时-ldl,编译和链接C文件时关于-ldl标志
- vue 页面多个倒计时
- 苹果手机支持鸿蒙,全球第三大手机系统「鸿蒙」上线,这19款能抢先用…
- c语言 动物的字符画,字符画构成的动物,多么奇妙!.......来看看吧!
- python蓝牙模块教程_python 蓝牙模块pybluz安装
- Oracle gsd服务是什么,如何处理11gR2 RAC下oc4j和gsd服务为OFFLINE状态 | 旺旺知识库
- UE4蓝图制作三维弹球学习笔记(二)