一、需求分析

1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。

2、文字转语音:转的语音不要太生硬。

3、截图文字识别(OCR):截屏完成即可弹出截图所含图片中的文字。

4、批量图片文字识别:选择多张图片,直接识别出每张图片的文字。

5、复制翻译:看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。

6、图种制作:这个不入流,纯属个人爱好,没啥技术含量。

经测试360杀毒将main.exe误报为病毒,请添加至白名单运行即可。

二、工具展示

需求产生开发动力,基于百度AI和pyqt5制作了自己的小工具,解决了上述所有需求,需求也就是功能了。

1、批量音频转文字

可批量选择要转换的音频即可自动识别,不限时长,免费,识别速度尚可,耐心等待。

(1)比如批量识别小学生课文

(2)比如识别长达五分钟的《荷塘月色》

(3)识别岳云鹏的相声

2、文字转语音

这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp3格式的音频文件。

3、截图OCR

点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。

4、图片批量识别

在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。如下动图演示:

5、复制翻译

看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。如下演示:

6、图种制作

没啥意思,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件,不做演示了。

三、软件使用

1、下载解压直接运行即可,注意运行弹出的黑窗不能关,目前还没办法去掉,o(╯□╰)o。

2、主界面参数配置,自己动手,输入百度AI的各种接口的key。各种key的获得方法免费,只不过注意免费次数,不过百度免费次数给的肯定够用了。

比如语音识别key获取可参考此文:https://jingyan.baidu.com/article/f3e34a12df0cddf5eb65359f.html

官方地址

html识别文字转语音,万能君工具箱v1.8 - 基于百度AI实现语音转文字/文字转语音/文字识别OCR/翻译...相关推荐

  1. 基于百度AI语音合成,使用python编写的语音朗读工具

    最近要考研,要阅读大量的书籍,希望读PDF文档的时候,能滑动一段文字后,电脑能自动读出声,这样就懒得自己读了. 因为电脑上的各种软件太过拉胯,所以自己写了一个在电脑上滑动取词的有声阅读. 如果需要的话 ...

  2. python 百度ai批量识别_Python基于百度AI的文字识别的示例

    Python基于百度AI的文字识别的示例 使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以自行传入一张带有文字的图片,进行识别. 下载baidu-aip这个库,可以直接 ...

  3. 基于百度AI的文字识别(Python语言)

    简 介:百度大脑是百度 AI 核心技术引擎,包括视觉.语音.自然语言处理.知识图谱.深度学习等AI核心技术和AI开放平台.本文介绍百度 AI 核心技术中文字识别功能的使用方法. 关键词:百度AI.文字 ...

  4. 百度ai文字转语音并下载php源码,一种基于百度AI的网页版在线语音包转文字的方法与流程...

    本发明涉及语音识别技术领域,特别涉及一种基于百度AI的网页版在线语音包转文字的方法. 背景技术: 语音识别技术,也被称为自动语音识别Automatic Speech Recognit1n, (ASR) ...

  5. python 百度云文字识别 proxy_Python基于百度AI的文字识别的示例

    Python基于百度AI的文字识别的示例 发布时间:2020-10-03 14:52:27 来源:脚本之家 阅读:66 使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以 ...

  6. 基于百度AI的图像文字提取应用程序

    基于百度AI的图像文字提取应用程序 现如今,图像提取文字功能被越来越多人需要,尤其是办公与教学.但是目前app提供的都是有偿服务,其实,我们完全可以自己编写小程序来实现,下面是小编自己制作的一个实现图 ...

  7. 基于百度AI开放平台的人脸识别及语音合成

    基于百度AI的人脸识别及语音合成课题 课题需求 (1)人脸识别 在Web界面上传人的照片,后台使用Java技术接收图片,然后对图片进行解码,调用云平台接口识别人脸特征,接收平台返回的人员年龄.性别.颜 ...

  8. 基于百度AI开放平台的人脸识别

    文章目录 前言 人脸识别流程图 一.注册账号 二.创建应用 三.下载SDK文件 四.创建工具类 五.创建用于人脸识别的网页 1.引入css文件 2.创建注册按钮 3.创建模态框,用于捕捉人脸 4.引入 ...

  9. Python基于百度AI的人脸识别系统--颜值检测

    基于百度AI的人脸识别系统–颜值检测 刚开始学,觉得好玩就写了这个 主要是分为人脸识别系统的对接,UI的设计 人脸识别系统: 用的百度的AI,其中的AK,SK可以换成自己的,在百度开放平台上注册就能获 ...

最新文章

  1. 彻底理解Python生成器和迭代器
  2. hdu1.3.8 As Easy As A+B
  3. RBAC(Role-Based Access Control,基于角色的权限访问控制)—权限管理设计
  4. 网络:.cookie和session原理及区别
  5. 关于UIView的autoresizingMask属性的研究
  6. 深度学习框架的比较(MXNet, Caffe, TensorFlow, Torch, Theano)
  7. 利用jdbc做一个购买的事务
  8. Swift标识符和关键字
  9. Qt图形界面编程入门(1)
  10. 前端笔记-vue中使用router进行页面跳转及除掉url中的#
  11. python中的commands模块
  12. 大量的linux、H3C、cisco、华为、模拟器、adobe教程
  13. Java第32课——求数组元素最大值
  14. Composition
  15. 2022年30本新年书单(要么旅行,要么读书,身体和灵魂总有一个在路上)
  16. Android 3G/4G流量上网原理简析
  17. 零基础学习嵌入式C语言要学习什么?
  18. 【架构思维】:设计服务降级的思路与方法
  19. 云计算的认识和看法_谈谈对于云计算的认识和理解
  20. 学习商业知识方面必须看的影片 .转

热门文章

  1. 计算机软件硬件系统,计算机硬件系统和软件系统
  2. ATtiny13与Proteus仿真-电池电量指示仿真
  3. ES6 环境下 Openlayers 集成使用 ol-ext 以及在线示例
  4. js基础 - 正则表达式的详细介绍以及电子邮件、手机号码的格式举例
  5. POJ 1265 pick 定理
  6. codeforces765-div2 C(dp一生之敌)
  7. 抖音团购直播间,一键自助设置秒杀
  8. 秒杀,在社群团购中这样玩……
  9. 【C】 字符数组:char,char*,char a[], char *a[], char **s 的区别与联系
  10. BCrypt算法加密解密