目的:因为最近主要使用ubuntu系统,想要将视频中的文字提取出来,实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴.

主要思路
利用截图软件gnome-screenshot 进行截取需要被文字识别的图片;
利用文字识别OCR软件tesseract,进行识别
将结果输出,复制到文件和剪切板

步骤1:安装依赖软件
安装tesseract
tesseract是一个开源的OCR引擎,最初是由惠普公司开发用来作为其平板扫描仪的OCR引擎,2005年惠普将其开源出来,之后google接手负责维护。目前稳定的版本是3.0。4.0版本加入了基于LSTM的神经网络技术,中文字符识别准确率有所提高。

添加源
sudo add-apt-repository ppa:alex-p/tesseract-ocr
更新源
sudo apt-get update
安装
sudo apt-get install tesseract-ocr
安装中文字库
tesseract支持60多种语言的识别不同,使用之前需要先下载对应语言的字库,下载地址:https://github.com/tesseract-ocr/tessd

在ubuntu20.10系统下实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴相关推荐

  1. Ubuntu20.10系统FreeCAD 0.19编译安装

    Ubuntu20.10系统FreeCAD 0.19编译安装 济南友泉软件有限公司 零.系统环境 root@test-HVM-domU:~# lsb_release -a No LSB modules ...

  2. Ubuntu20.4系统下安装kvm并创建虚拟机

    Ubuntu20.4系统下安装kvm并创建虚拟机 一.安装Ubuntu20.4系统 二.在Ubuntu20.4系统下安装KVM 三.kvm虚拟机及其磁盘映像文件(CentOS 7.9)制作 一.安装U ...

  3. 目标检测第5步:如何在Windows 10系统下,搭建YOLOv5(5.0)环境?保姆级,没有人比这个更详细了(更新时间2022.3.22)

    (请先看置顶博文)本博打开方式!!!请详读!!!请详读!!!请详读!!!_Cat-CSDN博客 目录 一.安装Anaconda或Miniconda 二.安装CUDA 三.安装cuDNN 四.安装Pyt ...

  4. linux添加HP网络打印机,在Ubuntu 18.10系统下安装HP网络打印机的方法

    本文介绍在Ubuntu 18.10系统下安装HP网络打印机的方法,只需要四个步骤就可以了.同样的方法也适合在Ubuntu 18.04系统下. 背景 最近做了个双系统Windows+Ubuntu 18. ...

  5. 【Ubuntu系列】Ubuntu20.04系统下3060显卡驱动安装记录

    [Ubuntu系列]Ubuntu20.04系统下3060显卡驱动安装记录 设备及相关信息简介 具体安装步骤 step1 获取显卡硬件信息 step2 在Ubuntu系统中卸载显卡驱动 step3 安装 ...

  6. Win 10 系统下搭建 Python 编程环境,有手就行

    前言 想把一门编程语言学好,会搭建编程环境无疑是有必要的,纵然有线上集成的编程环境,但那高度依赖于网络条件以及诸多情况,这使得我们在编程的时候难以存储自己的资料. 学习和使用 python 一年多以来 ...

  7. Windows 10系统下查看硬盘类型的方法

    本文主要介绍在 Windows 10 系统下,通过 Windows PowerShell 查看硬盘类型的方法. 通过快捷键"Win+S"打开搜索框,输入"Windows ...

  8. Macbook windows 10系统下录屏软件无法录制系统声音的问题

    Macbook Windows 10系统下录屏软件无法录制系统声音的问题 问题原因 Virtual Audio Cable 下载与安装 以Obs-Studio为例进行测试 录屏完成 参考教程链接 问题 ...

  9. Windows 10系统下哪些服务可以关闭?

    Windows 10系统下哪些服务可以关闭? Windows 10系统中很多服务和进程其实大家在平时都用不上,这些服务和进程不仅占用了很大部分的资源,而且还会影响系统的运行速度和安全.我们可以关闭那些 ...

最新文章

  1. 一年结构转换,陌陌走向稳健盈利,唐岩没有放手理由
  2. File类的构造方法
  3. 动态卡片:富媒体内容井喷式增长下,新一代移动端动态研发的模式
  4. Saying Good-bye to Cambridge Again --by Xu Zhimo
  5. 【论文复现】Hierarchical Attention Networks for Document Classification
  6. 洛谷——P1319 压缩技术
  7. python cnn模型_CNN系列模型发展简述(附github代码——已全部跑通)
  8. 拓端tecdat|Python贝叶斯回归分析住房负担能力数据集
  9. 德鲁克谈《自我管理》——《哈佛商业评论》史上最受欢迎的文章
  10. Unity 回合制战斗系统(中级篇)-血条和伤害数值
  11. 多媒体的计算机系统,多媒体计算机系统().PPT
  12. asp.net 引入html文件路径问题,asp.net 网站获取一个文件或文件夹的绝对路径,使用方法Server.MapPath(项目根目下虚拟文件路径)实现...
  13. 软件工程——经验软件工程概述
  14. nginx 上传文件大小限制
  15. matlab和通达信,通达信dllmatlab
  16. discord验证无法通过_如何通过Discord的“上线”直播
  17. 蓝桥杯题目练习(JAM计数法)
  18. 百度SEO比蜘蛛池还强大的推送工具收录宝
  19. CSP 201903-1 大中小
  20. java 自定义错误代码_Java 自定义异常(转载)

热门文章

  1. 【吴刚】UI拟物图标设计初级入门标准教程-吴刚-专题视频课程
  2. 如何在腾讯会议中使用PPT使用演讲者模式
  3. [转载]服务数据对象简介
  4. linux编译时-ldl,编译和链接C文件时关于-ldl标志
  5. vue 页面多个倒计时
  6. 苹果手机支持鸿蒙,全球第三大手机系统「鸿蒙」上线,这19款能抢先用…
  7. c语言 动物的字符画,字符画构成的动物,多么奇妙!.......来看看吧!
  8. python蓝牙模块教程_python 蓝牙模块pybluz安装
  9. Oracle gsd服务是什么,如何处理11gR2 RAC下oc4j和gsd服务为OFFLINE状态 | 旺旺知识库
  10. UE4蓝图制作三维弹球学习笔记(二)