WeChat-ASR

微信语音批量转文字 调用百度智能云短语音识别API 目前仅支持安卓手机+Windows

简介

最近线上办公,很多小会议或者讲座等也在微信群里,有时需要记录保存会议讲话内容,也可能为了节省时间,转成文字后快速浏览即可了解会议大致内容。

总之,微信自带的语音转文字虽然方便,但是面对多次的大量语音的时候一个一个点还是太麻烦了。用这个工具,第一次使用稍微有些麻烦,但是以后使用的时候还是会比较方便的。

原理

从手机(只写了安卓系统)找到文件夹,按时间提取需要识别的语音(还需要人工操作)

因为微信语音限制在60s,正好和百度asr限制一样,故不存在截取,准确性更高

用silk_v3_decoder 将微信的.amr文件转码.pcm文件

用百度智能云语音识别的API接口(需要申请账号)

生成txt,带顺序时间标志

运行环境

个人Windows 10+安卓手机可用

详细使用方法(文字版)

解压

从手机取出语音文件

手机连接电脑,并打开传输文件模式

依次访问\内部存储\tencent\MicroMsg\******************************\voice2

详细信息查看方式,并按时间排序

选中需要转码时间段的文件夹(建议从会议起始时间开始,到现在为止的文件夹全部选中),复制粘贴到电脑

筛选出需要的文件

在电脑上的新文件夹里,在右上的搜索为止搜索.amr

全选文件,复制粘贴到新文件夹

申请 百度智能云 API Key 和 Secret Key

左上方 产品->人工智能->语音技术->语音识别

左边中间位 立即使用

登陆 使用百度账号即可,可能需要手机验证

左边中间位置 创建应用

应用名称 应用类型 随便选,接口不用管,语音包名 不需要,应用描述随便写 点击创建

创建完毕后 中间位置点击查看应用详情

可以看到 API Key 和 Secret Key,这两个很重要,每次使用都要填入,建议保存在程序目录里的一个txt里

打开软件(不要管那个黑框框)

填入5里申请的 API Key 和 Secret Key 并连接

点击 '选择 .amr 文件',打开 4.b 里保存到的文件夹,选中会议时间的文件

可选 选择保存位置及名称

开始识别 (因为还不会写多线程,所以程序运行中一直假死,程序运行过程中不要动软件,等到完成时会有弹窗提示)

识别结束打开文件

推荐到word编辑,页面布局为窄,当修订校对完成后,用查找替换删除时间点 要开启通配符模式 “\{[0123456789_.pcm]{26,31}\}” (最好将文件保存下以免出现问题)

程序如果出现闪退等情况提交issue,常见解决方法(只能先凑合)在下载的文件中有

已知问题

菜单栏触发范围有问题

没有多线程,程序假死

python打包程序还是有点大

单元格不能复制

程序太丑,没有美化等

从手机中提取出录音文件对于大部分人来说难度还是偏大,第一次上手难度高

个人代码水平太低

会闪退

后记

最初是因为朋友有需求写的,但是没有做图形化界面。后来想着学学吧,就挖坑写了,不过也学了不少东西

应该也有许多人会用到吧,想着慢慢也升级一下,支持从手机直接读取录音文件?支持苹果设备等等,不过还不确定,如果有需求,那我就写写

python提取微信聊天语音_GitHub - dennischancs/wechat-asr: 微信语音批量转文字 python编写 用百度智能云短语音识别API实现 windows下的使用...相关推荐

  1. 人脸表情识别 微信小程序 百度智能云人脸识别API(含完整项目文件)

    展示 界面展示 正下方三个按钮: 左边:切换前后置摄像头 中间:拍照 右边:选择相册 识别结果展示 图像中有人脸时显示识别结果: 图像中无人脸时不显示识别结果: 获取百度智能云人脸识别API 1.进入 ...

  2. 微信公众号图灵机器人开发php,使用图灵机器人api搭建微信聊天机器人php实现,图灵微信聊天机器人...

    使用图灵机器人api搭建微信聊天机器人php实现,图灵微信聊天机器人之前通过hook技术实现了微信pc端发送消息功能,如果在结合图灵机器人就能实现微信聊天机器人. 代码下载:http://blog.y ...

  3. 调用百度智能云API,实现身份证智能识别并转语音 | Python

    一.百度云新建应用.获取权限和额度 1. 登录百度智能云,产品服务-->人工智能-->图像识别 2. 应用列表-->创建应用,用于身份证照的信息识别 3. 应用创建完成,得到APP_ ...

  4. 用Python提取图片中的文字——百度智能云API

    百度智能云有很多功能,直接接入接口就可以调用函数使用,这里我们使用简单的方式,直接调用,不适用OpenCV.TensorFlow啥的..毕竟我不是大佬... 安装库 首先安装Python库,使用pip ...

  5. 利用python+百度智能云为人物头像动漫化(附API代码及SDK代码)

    文章目录 前言 1.2.打开第一个搜索结果 1.3.点击立即使用 1.4.创建应用 1.5.获取APPID等参数 二.API与SDK的使用 1.API代码 2.SDK使用 2.1.首先下载python ...

  6. Python调用API打造一个语音合成系统(百度智能云)

    Python调用API打造一个语音合成系统(百度智能云) 将文字转换成各种不同味道(大叔型,萝莉音,精神小伙型等)的语音. 申请一个百度智能云账号 使用Python开发一款智能语音合成系统,所以需要P ...

  7. python图像识别步骤_利用百度智能云结合Python体验图像识别(转载来自qylruirui)

    利用百度智能云结合Python体验图像识别 只要注册了百度账号就可以轻松体验百度智能云中图像识别功能的魅力! 1. 所需要的工具 一个百度账号(大家都有哈) 一个可以运行python代码的编译器(Py ...

  8. python 菜品识别_利用百度智能云结合Python体验图像识别(来自qylruirui)

    利用百度智能云结合Python体验图像识别 只要注册了百度账号就可以轻松体验百度智能云中图像识别功能的魅力! 1. 所需要的工具 一个百度账号(大家都有哈) 一个可以运行python代码的编译器(Py ...

  9. 【项目实训】基于人脸识别的课堂签到管理系统(python+qt5+sqlite3+百度智能云)

    [项目实训]基于人脸识别的课堂签到管理系统(python+qt5+sqlite3+百度智能云) 一.环境介绍 二.签到功能 2.1 启动签到 2.2 结束签到 三.用户组操作 3.1 添加用户组 3. ...

最新文章

  1. linux 脚本 变量为空,Shell脚本中判断输入变量或者参数是否为空的方法
  2. es6 函数解构的用途
  3. Freemarker静态化ActiveMQ实现
  4. Excel文件弹出另存为代码
  5. Windows 自启动总结《转》
  6. 前端学习(3049):vue+element今日头条管理-请求获取数据
  7. Oracle性能优化
  8. HBase数据模型和读写原理
  9. 避免门事件 巧妙清除搜狗浏览器记录
  10. python锁机制_Python并发编程之谈谈线程中的“锁机制”(三)
  11. mysql 递归查找父节点_MySQL递归查询父子节点
  12. win10电脑桌面透明便签_win10桌面透明悬浮便签怎么常驻桌面
  13. 高德地图Web端JavaScript API开发(二)---在地图上绘制(点标注)
  14. redis的活动倒计时秒杀问题
  15. 苹果电脑打开wps云文档方法
  16. PRML(3)--Chapter2(上)-概率分布-二元变量、多项式变量、高斯分布、指数族分布
  17. Python文档算法整理
  18. 椭圆曲线加密概览(二)
  19. mac:设置多久后息屏
  20. 29、栈的压入、弹出序列

热门文章

  1. 腾讯T9级到底需要什么样的技术水平?我们又该如何学习?
  2. HTML小游戏8 —— 小霸王游戏机网页版(附完整源码)
  3. 12306 余票检测软件
  4. html文件怎么在wps打开是乱码,wps上打开Excel文件是乱码
  5. 简明扼要理解YOLOX
  6. 背单词软件速度对比测试,手机背单词大比拼,谁才是速度之王
  7. 获奖结果公布|2020腾讯犀牛鸟云开发校园技术布道师养成计划
  8. 设计模式之美总结(结构型篇)
  9. byte java 详解_详解java中的byte类型
  10. 萌娃人脸生成器 实践踩坑笔记