本帖最后由 zhaoyun007 于 2019-6-29 20:10 编辑

V2.0版更新:

加入免费的音频转文字接口,免费的有普通话、英文、粤语、四川话识别,速度慢些,但准确率还可以。

QQ截图20190629200803.png (50.44 KB, 下载次数: 131)

2019-6-29 20:09 上传

---------------------------------------------------------------------------------------------------------------

一、需求分析:

1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。

2、文字转语音:转的语音不要太生硬。

3、截图文字识别(OCR):截屏完成即可弹出截图所含图片中的文字。

4、批量图片文字识别:选择多张图片,直接识别出每张图片的文字。

5、复制翻译:看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。

6、图种制作:这个不入流,纯属个人爱好,没啥技术含量。

二、工具展示

需求产生开发动力,基于百度AI和pyqt5制作了自己的小工具,解决了上述所有需求,需求也就就是功能了。

1、批量音频转文字

可批量选择要转换的音频即可自动识别,不限时长,免费,识别速度尚可,耐心等待。

(1)比如批量识别小学生课文

160137efhzg511frudr1rv.png (20.77 KB, 下载次数: 32)

2019-6-26 12:47 上传

(2)比如识别长达五分钟的《荷塘月色》

160139oej3tjyx6w82gnpx.png (35.06 KB, 下载次数: 31)

2019-6-26 12:47 上传

(3)识别岳云鹏的相声

160141nhz5zk7hem8ohe7o.png (13.18 KB, 下载次数: 25)

2019-6-26 12:47 上传

2、文字转语音

这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp3格式的音频文件。

QQ截图20190626124836.png (31.33 KB, 下载次数: 31)

2019-6-26 12:50 上传

3、截图OCR

点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。

1.gif (326.35 KB, 下载次数: 28)

2019-6-26 12:57 上传

4、图片批量识别

在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。如下动图演示:

2.gif (682.33 KB, 下载次数: 27)

2019-6-26 12:57 上传

5、复制翻译

看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。如下演示:

v2-96e44448ca692ed5bdbf0ef7cae8bc53_b.gif (345.97 KB, 下载次数: 26)

2019-6-26 12:57 上传

6、图种制作

没啥意思,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件,不做演示了。

QQ截图20190626124924.png (16.66 KB, 下载次数: 25)

2019-6-26 12:50 上传

三、软件使用

1、下载解压直接运行即可,注意运行弹出的黑窗不能关,目前还没办法去掉,o(╯□╰)o。链接:https://pan.baidu.com/s/1eHuCzBAKtvvSTkHatWzRZA 提取码:usex

2、主界面参数配置,自己动手,输入百度AI的各种接口的key。各种key的获得方法免费,只不过注意免费次数,不过百度免费次数给的肯定够用了。

比如语音识别key获取可参考此文:https://jingyan.baidu.com/article/f3e34a12df0cddf5eb65359f.html

然后给出官方地址

QQ截图20190626124944.png (27.59 KB, 下载次数: 26)

2019-6-26 12:50 上传

四、注意事项:

软件做的仓促,界面简陋,且各种未知bug再所难免,如有建议可跟帖回复。

下载链接:提取码:usex

python自制语音识别_为了满足我的需求,自己用python写了个小工具合集,包括图片、语音识别、翻译pdf等...相关推荐

  1. 同等质量下那种图片格式小_最实用的Window小工具合集,总有一款适合你!

    HELLO,我是利兄~ 我们在日常办公的时候,总是被一些小事情难住,这个时候,一些小工具就可以为我们提供帮助. 今天利兄就来推荐一波办公的时候可能会用到的小工具合集,记得收藏哦. 1.图片下载助手 这 ...

  2. Python研发工程师必备工具合集

    Python研发工程师必备工具合集 1.必备工具 2.常用网站 3.学习路线 4.必备技能 5.书籍推荐 6.进阶学习 一.必备工具: 1.Sublime Text 2.Notepad++ 3.Vis ...

  3. 5去掉button按钮的点击样式_各种好看的小按钮合集,纯css编写,最近在学习时遇到的,记录成为笔记...

    写在前面 最近忙着实习的事,前往广州,租房,置办东西等等.用碎片化的时间看了一些博客,也看到不少我认为很不错的通过纯css来打造的按钮样式.记录下来以后开发的时候或许能用上. 亮起来按钮 <di ...

  4. button按钮样式_各种好看的小按钮合集,纯css编写,最近在学习时遇到的,记录成为笔记...

    写在前面 最近忙着实习的事,前往广州,租房,置办东西等等.用碎片化的时间看了一些博客,也看到不少我认为很不错的通过纯css来打造的按钮样式.记录下来以后开发的时候或许能用上. 亮起来按钮 < 简 ...

  5. 【kimol君的无聊小发明】—用python写截屏小工具

    [kimol君的无聊小发明]-用python写截屏小工具 前言 一.技术实现 1. 相关库 2. 定义窗口 3. 绘制工具条 4. 定义事件函数 二.后续改进 写在最后 前言 今天我看了一下自己的文件 ...

  6. Python渗透测试工具合集及书籍推荐(转)

    Python渗透测试工具合集 如果你热爱漏洞研究.逆向工程或者渗透测试,我强烈推荐你使用 Python 作为编程语言.它包含大量实用的库和工具,本文会列举其中部分精华. 本文转自: http://ww ...

  7. Python【小游戏合集】之重温童年最爱的扫雷小游戏

    导语: 哈喽吖!有许多铁汁们私信小编说用Python自行制作小游戏 ‍ ‍ 之后简直就是上头了~让wo多出一点小游戏合集(看来铁汁们跟小编一样都酷爱游戏) 有求必应~小游戏立刻安排上啦~~(扫雷真的是 ...

  8. Python安全测试工具合集

    Python安全测试工具合集 转自:http://netsecurity.51cto.com/art/201311/417021.htm ------------------------------- ...

  9. python自制电子记事本_利用Python制作一个“电子记事本”

    案例内容 今天的挑战就是写一个"记事本"小程序.程序的功能分为三个部分: 1.把内容记录到文件. 2.显示记录的所有内容. 3.删除不再需要的内容. 正式的"记事本&qu ...

最新文章

  1. [JOISC2014]バス通学
  2. VirtualBox虚拟机开机后台自启动
  3. 特征检测器 FeatureDetector
  4. 【计算机组成原理】各种码表示的数
  5. java将字节数组转换成字符串,面试心得体会
  6. 华为AI音箱更新春节专属技能:对春联 拜年留言
  7. 冲刺秋招!离拿到心仪Offer你还差什么?
  8. [LeetCode]Reverse Integer
  9. C语言的本质(19)——预处理之一:宏定义
  10. 利用TestDriven.net和NUnit进行单元测试(转)
  11. KND数控系统PLC开发环境
  12. matlab中的semilogy,MATLAB 函数Semilogy()
  13. js 获取浏览器经纬度精确到100米(chrome,firefox等大浏览器,ios,安卓亲测可用)
  14. 电子元器件手册中assert和deassert的含义
  15. 关于无法进入XP系统的解决方法
  16. Cadence Allegro打阵列过孔方法图文教程及视频演示
  17. RHEL 5下iSCSI Initiator软件安装配置指导
  18. 大数据常见英文词汇(待更新)
  19. JOBDU-OJ 1456 胜利大逃亡
  20. 微信小程序 lookup 联表查询

热门文章

  1. 计算机应用 外审一天完成,计算机仿真外审多长时间
  2. 达人评测 i5 13400和r5 7600x选哪个好 酷睿i513400和锐龙r57600x差距
  3. Go项目的目录结构基本布局
  4. 北京邮电大学计算机网络课件,北京邮电大学计算机网络课件第一章:物理层.ppt...
  5. Private关键字详解
  6. 2021-04-24 蓝桥杯 Python 第五题--密室逃脱
  7. VNC协议-认证过程
  8. 网络层(八)ARP欺骗
  9. rk3188--4.android用initrd文件系统启动流程
  10. Roof-line Model性能分析模型简介