吐槽

提起语音克隆技术业内人人士估计都知道Real Time Voice Cloning,谷歌工程师的论文SV2TTS,由比利时列日大学的研究人员复现了该框架并开源了他们的实现。本来挺感兴趣的,试想如果能把亲人的语音克隆带在身边是多么美妙的事情,其实我也很想克隆我儿子的声音,毕竟他长得太快了,不过兴趣是兴趣,现实是现实,研究了几天由于内功不够深厚差点走火入魔,py学习时间仅有个把月的我还是暂时封印它吧。
但是SV2TTS太美妙了,比如TTS语料库惊人,类似清华公开的库动不动就十几个G,而SV2TTS只需要简单的几句话就可以克隆出不错的效果。标贝提供了这样的服务,所以体验了一下,感觉还不错,除了合成出来的语音有点机械化,但是出来的结果还是可圈可点的。

代码

import requests,json
import struct
import pyaudioclientId="申请的ID"
secret="申请的"def getToken():# 24小时过期默认url = "https://openapi.data-baker.com/oauth/2.0/token?grant_type=client_credentials&client_secret=" + secret + "&client_id=" + clientIdanswer = requests.get(url)data = json.loads(answer.text)return data['access_token']"""
test:文字
voice_name:模型id
audiotype=3 :返回16K采样率的mp3格式
audiotype=4 :返回16K采样率的pcm格式
audiotype=5 :返回8K采样率的pcm格式
audiotype=6 :返回16K采样率的wav格式
audiotype=6&rate=1 :返回8K的wav格式
audiotype=7 :返回8k8bit的alaw格式文件
audiotype=8 :返回8k8bit的ulaw格式文件
audiotype=9 返回8K采样率的mp3忽略file_name直接播放
"""
def zhtts(text,voice_name,file_name="",audiotype="6"):token=getToken()# domain为固定值1url="https://openapi.data-baker.com/tts_hot_load?" \"access_token="+token+"&domain=1&text="+text+"&voice_name="+voice_name+"&language=zh"+"&audiotype="+audiotypeanswer = requests.get(url)res=answer.contentif(len(file_name)==0):p = pyaudio.PyAudio()stream = p.open(format=p.get_format_from_width(2),channels=1,rate=16000,output=True)stream.write(res)stream.stop_stream()  # 暂停stream.close()  # 关闭p.terminate()else:with open(file_name, "wb") as f:for x in res:s = struct.pack('B', x)  # 转换为字节流字符串,B代表unsigned charf.write(s)zhtts("君不见,黄河之水天上来,奔流到海不复回。君不见,高堂明镜悲白发,朝如青丝暮成雪。","你申请的模板ID")

使用流程也很简单,申请个ID和SECRET->在APP上录制语音大概12段->上传等待训练结果->拿到模型ID->调用上面的代码

加油,希望我明年能有实力拿下它

python 标贝 模拟人声/语音克隆/语音复刻(API)体验相关推荐

  1. 语音识别1-3语音克隆-语音转文字-聊天盒子-python

    语音识别 文本合成语音 克隆声音项目 语音转文字 bug解决 文字转语音 不保存文件转语音 重复自己刚说过的话 聊天盒子 环境信息 B站教学视频跳转 音频格式在线转换: https://www.aco ...

  2. 实时中文语音克隆|开源项目MockingBird体验

    lake2 引子 在今年大型网络攻防演练前不久,笔者接到一个公司的座机号码来电,上来就问防守准备得怎么样了,哪里还有不足等.等等,这声音不认识,笔者第一反应就是蓝军(Red Team)来进行社会工程攻 ...

  3. 手把手教你用JAVA实现“声音复刻”功能(复刻你的声音)标贝科技

    手把手教你用JAVA实现"声音复刻"功能(复刻你的声音)标贝科技 前言 什么是声音复刻? 使用少量的用户声音,短时间内快速为用户量身打造个人定制音色 一.内容太长不愿意看,直接使用 ...

  4. 标贝科技推出情感合成 TTS,让语音交互更有温度!

    语音合成技术已进入到人们的日常生活,有声阅读.智能客服.智能家居等场景都已经出现了"它"的身影.有情感的声音,赋予机器生命感,让人机交互更美好.简单. 5月28日,标贝科技重磅推出 ...

  5. 标贝科技登全球语音大赛舞台Blizzard Challenge做精彩开场发言

    继语音论文成功入选并亮相全球顶级语音学术会议INTERSPEECH2019后,标贝科技再登全球语音大赛舞台Blizzard Challenge2019(译为暴雪挑战赛). 9月23日,全球语音合成领域 ...

  6. 标贝科技亮相2019中国互联网大会 解决语音合成定制需求痛点

    2019中国互联网大会于7月9日-11日在北京国家会议中心举行.本次大会以"创新求变再出发"为主题,开设物联网.人工智能等系列分支论坛,汇聚国内重点科研机构及众多知名互联网及人工智 ...

  7. tts代表_标贝科技推出情感合成TTS 多情感、强表现力声效让交互更有温度

    语音合成技术已进入到人们的日常生活,有声阅读.智能客服.智能家居等场景都已经出现了"它"的身影.有情感的声音,赋予机器生命感,让人机交互更美好.简单. 5月28日,标贝科技重磅推出 ...

  8. 标贝科技推出「留声机」TTS方案,高还原、个性化声效提升交互意愿

    3 月 5 日,标贝科技推出全新 「留声机」,该方案具有高原度复刻效果,用户只需 5 分钟左右即可完成录制,训练过程全自动化处理,大约 2 小时后,即可拥有媲美原声声音的个性化模型,轻松实现文本转语音 ...

  9. 标贝科技|AI企业级应用榜单发布,百度、讯飞、标贝科技等50家产品上榜

    近日,由企服行业头条组织筹办的<AI企业级应用产品实力榜单>,本周已经正式对外发榜. 企服行业头条是3W集团旗下定位于企业服务行业的垂直新媒体,对关注企服领域内的新产品.新公司.新观点.新 ...

最新文章

  1. 从百度地图看北京和上海
  2. 依图超车争夺AI创业第一股!冲刺科创板,募资75亿为造芯,去年营收91%投向研发...
  3. Canopy聚类算法分析
  4. [原创]简单即是美:QQ2009英文版
  5. jquery粘贴按钮_实现前端点击按钮自动复制剪贴板功能
  6. 统信UOS桌面版游戏攻略
  7. 博士申请 | 新加坡国立大学Xinchao Wang老师招收图神经网络方向博士/博后
  8. win7下关闭wps热点和wps云文档自动漫游的方法
  9. MySQL索引原理以及查询优化
  10. Choerodon猪齿鱼实践之持续交付流水线
  11. 上海杨浦|2022年杨浦 “ 创业之星 ” 大赛
  12. Word排版过程中多个参考文献一起引用
  13. 四川2021高考体考成绩查询,2021年四川体育类专业成绩查询时间及入口_中职中专网...
  14. windows7装机必备软件及设置
  15. DuerOS智能设备激活数突破1亿 小度购物节再掀热潮
  16. 6G新天线技术白皮书(附下载)
  17. Linux如何强制关闭PyCharm或者其他软件
  18. 月薪2W-3W!腾讯/阿里/网易等大厂都缺的人才...
  19. 双十一频繁弹窗,一招解决
  20. Docker compose部署 Maven私服

热门文章

  1. 18.2 增强型图元文件
  2. stm32f103gd32的usb虚拟串口,打印类printer组合设备
  3. reporting service odbc mysql_Reporting Services
  4. 常用的几个软电话客户端配置
  5. 如何使用docker和docker-compose在本地Testnet上开发EOS区块链
  6. [Graphics]自组织植物建模方法(ContinousLassoBrush)
  7. Python数据结构与算法题目 打印二叉树的左视图 打印二叉树的右视图 树的左视图 树的右视图
  8. Windows系统下的百度云不限速
  9. eclipse jdt
  10. java判断颜色合法_判断颜色是否合法的正则表达式(详解)