文章目录

  • 需求
  • 原理
  • 需求升级
  • 实现

需求

1.最近看pdf文档以及一些文本文档,不想看,想着文档自己能说话把自己的内容读出来就行了
省的我还得看,我就闭着眼听文档自己读
2.怎么触发这个功能?快捷键,或者鼠标手势

就这样,鼠标划一下,自动激活
为什么鼠标划的图案设置成w呢?我觉得他像声音的波形,比较好记,
这样的话当我选择了文字,然后鼠标划出这个图案,文字就能自动朗读了

原理

1.首先选择文字段落,这个要开发的软件应该能够自动将这些文字内容复制进入剪切板,实现"Ctrl C"功能
2.这个软件应该读出剪切板的文字,并将这些文字送入百度的文字转语音接口,得到回传的语音
3.播放得到的语音
4.使用mouseinc鼠标手势软件,为这个软件设置快捷键,然后使用鼠标手势触发
给这个要开发的小软件设置的快捷键是Ctrl Shift Alt L,就怕有重复的快捷键,使劲复杂着设置

需求升级

有些文字无法复制,能否截图识别,实现ocr功能,自动识别出图片的文字然后自动朗读

呵呵,这个是伪需求,因为我的pdf文档的文字可以复制,我i暂时够用,这个升级的需求就不要了,等看的文档文字不能复制再升级功能吧

实现

import pyperclip
from aip import AipSpeech  # 这是百度的aip包,
import pygame
from mutagen.mp3 import MP3
import time
import os
global flag_last_music_name
flag_last_music_name = 0
# # 复制到粘贴板
# pyperclip.copy('牛顿')
# 从粘贴板读出
spam = pyperclip.paste()
print(spam)
basic_path = r"C:\Users\Administrator.DESKTOP-KMH7HN6\AppData\Local\Temp\python_pgm\my_voice_brain\mymusic"
def play_sentence(myword):global flag_last_music_nameflag_last_music_name = flag_last_music_name + 1if myword:lan = mywordAPP_ID = ''  # 引号之间填写之前在ai平台上获得的参数,百度语音接口密钥,免费的,自己去百度的开发者平台注册API_KEY = ''  # 如上SECRET_KEY = ' '  # 如上client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)result = client.synthesis(lan, 'zh', 1, {'vol': 10, 'per': 1, 'spd': 3, 'pit': 5})'''固定值zh。语言选择,目前只有中英文混合模式,填写固定值zh客户端类型选择,web端填写固定值1spd语速,取值0-15,默认为5中语速(选填)pit音调,取值0-15,默认为5中语调(选填)vol音量,取值0-15,默认为5中音量(选填)per发音人选择, 0为普通女声,1为普通男生,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女声'''# 识别正确返回语音二进制 错误则返回dict 参照下面错误码name_music = str(flag_last_music_name)last_name_music = str(flag_last_music_name - 1)path = basic_path + '\%s.mp3' % (name_music)last_path = basic_path + '\%s.mp3' % (last_name_music)if not isinstance(result, dict):with open(path, 'wb') as f:f.write(result)pc_play_music(path)if (flag_last_music_name > 2):try:os.remove(last_path)except:print("没有发现应该删除的音频")#语音文件播放后删除,不留着,播放后就没用了# 我的意思是音乐播放完就删除,要不然一直生成语音文件,谁受得了
def pc_play_music(n):global flag_play_commandflag_play_command = 0print("开始播放音乐")audio = MP3(n)pygame.mixer.init()path = npygame.mixer.music.load(path)pygame.mixer.music.play()for i in range(0, int(audio.info.length) + 2):if i == int(audio.info.length) or flag_play_command == 1:  # 表示有应用请求音频或者已经播放完pygame.mixer.music.stop()pygame.quit()flag_play_command = 0breakelse:time.sleep(1)print("播放完成")
play_sentence(spam)

python小工具-使用百度语音接口进行划字朗读相关推荐

  1. Python 小工具:调用「百度翻译API」实现英汉互译及多语言翻译

    Python 小工具:调用「百度翻译 API」实现英汉互译及多语言翻译 API 简介 过程详解 完整代码 结果展示 附:官方 Demo - Python 2 版本 Python 小工具:调用「百度翻译 ...

  2. python小工具小发明_用python写PDF转换器的实现

    前言 某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~ 当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码.我拍腿正坐,一个想法油然而生:"生活已然很无聊,不如再无聊些叭" ...

  3. Python小工具之翻译词典

    Python小工具之翻译词典 功能实现:请求网易有道词典的接口,获取翻译结果 代码如下: # -*- coding:utf-8 -*- """ Python制作翻译词典 ...

  4. Python小工具——唐诗三百首朗读

    Python小工具--唐诗三百首朗读 工具简介 系统语音朗读唐诗三百首,可自己选择要朗读的唐诗,可搜索查找唐诗进行朗读,可用于幼儿园或小学生熟悉唐诗,积累文学素养. 工具界面 1.打开工具 可查看当前 ...

  5. python小工具myqr生成动态二维码

    python小工具myqr生成动态二维码 (一)安装 (二)使用 (一)安装 命令: pip install myqr 安装完成后,就可以在命令行中输入 myqr 查看下使用帮助: myqr --he ...

  6. 自己整理实现的python小工具

    文章目录 记录一些自己整理实现的python小工具 python获取文件路径 pytho使用opencv进行图像拼接 记录一些自己整理实现的python小工具 python获取文件路径 因为有的程序需 ...

  7. PHP利用百度语音接口,实现文字图文转语音播放

    需求背景:本人有一个美食网站(百度搜大厨子美食网),有很多美食食谱,存在用户边做饭边看食谱,如果能用语音播放食谱,用户就不用一直盯着手机了. php代码如下: // 通过百度语音接口文字转语音$tar ...

  8. python小工具—图片转为字符txt

    python小工具-图片转为字符txt 图片转为字符txt python小工具-图片转为字符txt 效果展示 转换图片信息 图片信息转字符 完整代码 效果展示 转换图片信息 将图片的rgb色彩信息转为 ...

  9. 【Python小工具】若干图片合并生成动态图(.gif)

    相信很多学生党.上班族在日常的学习.科研.办公中总会有一些比较特殊的需求,本人作为一个理工科(非计算机相关专业)学生和大家一样.有时好不容易找到了比较心仪的工具,却发现还要收费,质量和使用的便捷性也不 ...

最新文章

  1. POJ - 2337 Catenyms 欧拉回路
  2. 如何优雅地展示机器学习项目!
  3. linux系统调用(syscall)原理
  4. python图像直方图与直方图均衡化
  5. 安装 Cacti 监控
  6. hikari如何切换数据源_hikari数据库连接池
  7. win7 php mysql扩展名_Win7 配置Apache+PHP+Mysql环境
  8. Linux内核的启动过程分析
  9. oracle 连接图示,ORACLE 表连接方法
  10. python创建ppt_python生成ppt的方法
  11. baidumap 判断是否安装百度地图客户端
  12. Exploit-exercises
  13. 【BZOJ4199】【NOI2015】品酒大会(后缀数组)
  14. 如何使用MATLAB绘制ggplot风格图片(散点图及折线图)
  15. JVM堆内存(新生代,老年代,Xms,Xmx)学习整理
  16. 计算机操作系统执行可执行程序时,内存分配详解
  17. 英文词典中的那些词性缩写字母的原型
  18. 一道选择题,让我搞懂了嵌套函数的基本运行逻辑
  19. 【DRP项目】安装Oracle数据库之服务端安装+客户端安装(一)
  20. 星网锐捷语音网关密码重置恢复出厂设置

热门文章

  1. centos7在编译hisi3518e_sdk时遇到的问题
  2. Boson NetSim for CCNP 7.06全套搞定
  3. android MediaRecorder录制音视频实现直播的基础
  4. ESG数据更新 | 商道融绿ESG评级(2015-2022年)
  5. 智能工具Cursor安装和使用
  6. 《约翰·克里斯朵夫 》
  7. Centos 常用命令小记
  8. 纯css制作钟表(会走动)
  9. 保留关键字 (Transact-SQL)
  10. wordpress导航栏设置