如何将瑞克和莫蒂的字幕和音频抓下来练习口语
通过阅读剧本或者字幕来练习口语是一个有趣且高效的方法,我选择的是瑞克和莫蒂,下文记录一下全过程。
一、选它的理由:
1、对话密集,短对话多
这点很重要,因为这是练习口语的需要。我并不想向过去一样背诵新概念或者是长篇的英文课文,所以排除叙述性太强的例如BBC或者英文纪录片。
有一些剧的特点是人物都比较高冷,对话不多,而我希望在我一集一集的练习时间中人物最好无时无刻不再说话,这样 瑞克和莫蒂 每集二十分钟的连贯对话就是非常好的选择。当然如 老友记 或者其他比较生活化的剧集也十分不错。
2、故事性强,可以N刷
要拿一部剧的剧本来作为练习素材,喜欢这部剧是非常重要的。最好是平常都有n刷的剧再好不过。在通读完字幕后再刷完全可以找生肉练习听力。
二、如何获取字幕文件
1、字幕库直接搜索
字幕库
这个网站的字幕我感觉是比较齐全的了,可以看到上面的字幕文件,有以下两种,.srt就是从MKV视频中提取出来的字幕格式,.ass是外挂字幕的格式。
.srt格式如下:
.ass格式如下:
我后续所有的字幕文件都使用的是.srt格式的,因为.srt的格式比较方便写个脚本处理,而且.ass文件可以从网页上一键转换成.srt文件。
字幕格式转换
2、从mkv格式视频中抓取字幕
即便是上面提到的字幕库,在上面搜索瑞克和莫蒂也缺少第三季的字幕素材(现在我已经上传)。遇到这种情况,就需要从mkv视频中抓取字幕。
1)下载mkvtoolnix,
2)打开MKVExtractGUI.2.3.0.0.简体汉化版
拖入要处理的视频,就可以看到如下分轨,即可提取出字幕文件和音频文件。
ps:如果没有MKVExtractGUI.2这个软件需要单独下载然后拖入mkvtoolnix的文件夹。
pps:当然只需要音频文件的不用这么麻烦,任意格式视频和格式工厂就可以搞定。
三、如何处理字幕文件
1、去掉字幕文件中的帧数、时间轴和空行
由于我也是初次使用python,所以这个小脚本可能写得不太好,但是可以用,每一步骤我都尽力标注了一下方便后面修改:
import os
import re
import numpy as nppath = os.getcwd() # 定位到当前地址
name = 0
for h in os.listdir(path):if re.match('.*.srt', h): #匹配剧本文件name = name + 1orifile = open ( h ,'r+') #encoding取决于文档编码格式insfile = open (str(name) + '.txt' , 'w+') #由于这里原文档编码格式不同的话写入会乱码,所以建立临时文档#outfile = open ('S03','a') #都输出到同一个文档内if name < 10:outfile = open ('S03E0' + str(name) + '.txt','a')else:outfile = open('S03E' + str(name) + '.txt', 'a')content = orifile.read()insfile.seek(0,0)insfile.write('\n'+content)#locate = re.search('1',content) #当文档前有多行空行时需要定位,一般不用#coordinate = locate.start() - 1#insfile.seek(coordinate,0)insfile.seek(0, 0)i = 0 #每隔固定行输出一行j = 0 #多行错误for line in insfile.readlines():if line != '\n' and j == 1: #空行'\n' #当前帧多行i = i - 1print(line) #检查多行错误,有必要要的继续加进去print(h)#outfile.write(line)j = 0i = i + 1if i == 5 : #每隔固定行输出一行if line != '\n': #避免少行错误outfile.write(line)i = 0j = 1 #避免多行错误else: #当前帧少行i = 1j = 0
2、在word中录制宏来统一处理格式
这里我就不赘述了。
四、进行口语练习
通过上述的方法可以抓取其他你喜欢的剧集的字幕和音频。
现在拿到了剧本和音频,就可以跟读,角色扮演来练习口语,我的建议是把剧本打印出来,开通一个喜马拉雅或者其他FM的主播号,将音频做成专辑传上去,在实际练习时比较好控制进度条,语速,尤其是这种听书软件的+15s,-15s设计很好控制播放进度。需要注意的是版权问题,一定要上传成私密专辑。
如何将瑞克和莫蒂的字幕和音频抓下来练习口语相关推荐
- 瑞克·李特的追寻 正是我们所需要做的!中国
瑞克·李特的追寻 别人放弃,自己还是坚持:他人后退,自己还是向前:眼前没光明.希望,自己还是努力奋斗.这种精神,是一切科学家.发明家及其他有大成就的人物成功之原因. --马尔腾 凌晨5点,瑞克·李特开 ...
- FITC/ICG/TMR/HRP/Cy3荧光标记阿法替尼/阿西替尼/克里唑蒂尼/奥拉帕尼/Lenvatinib/多韦替尼 等药物
异硫氰酸荧光素(FITC)标记 异硫氰酸荧光素(FITC)具有永久性标记生物分子的独特检测性能,可用于检测或跟踪共轭物与其他生物分子的相互作用.FITC是荧光素的异硫氰酸酯衍生物,主要通过对其5-碳位 ...
- 做游戏,学编程(C语言) 18 瑞克快跑
分享16级同学大一上学期实现的瑞克快跑,它是一款跑酷游戏,目标是躲避障碍物.取得高分.分步骤代码.可执行程序.录屏效果可以从百度网盘下载:http://pan.baidu.com/s/1bpNAwoB ...
- 固瑞克机器人电焊密封胶胶枪枪嘴_胶枪的使用方法
作为国产货的典型代表,小米在近几年来也是突飞猛进的发展,不仅致力于手机领域,在净水机和空气净化器领域也有一定的发展,尤其是小米净水机,可以说现在很多消费者都会首先考虑,那么小米净水机的安装知识您了解吗 ...
- 瑞芯微RV1126使用官方sdk进行音频编码
记录一下在使用1126进行音频编码中遇到的一个问题,根据官方文档:Rockchip RKMedia Development Guide 参考sdk目录external/rkmedia/examples ...
- framer x使用教程_如何使用Framer Motion将交互式动画和页面过渡添加到Next.js Web应用程序
framer x使用教程 The web is vast and it's full of static websites and apps. But just because those apps ...
- python自动生成鸡汤文_20行python代码实现鸡汤智能生成器
"Don't think of the overwhelming majority of the impossible." "不要去想不可能之事" " ...
- 个人项目api接口_5个免费有趣的API,可用于学习个人项目等
个人项目api接口 Public APIs are awesome! 公共API很棒! There are over 50 pieces covering APIs on just the Towar ...
- python 随机名言_如何用简易代码自动生成经典语录
"不要空想不可能的事情" "增加自己的幸福感" "我们最终将创造地面,并呵护它" "保持希望并学会放弃奇迹" 上面所有引 ...
最新文章
- Git fetch和git pull的区别
- 如果地府需要一个后台管理系统,你会如何设计?
- Linux下实现多网卡绑定
- LeetCode Kth Largest Element in an Array(小根堆)
- Android之如何解决刚下载的Android studio(包括上面的菜单栏)乱码问题
- C++之泛型编程(模板)
- java 执行顺序_Java代码执行顺序
- 马斯克:大量特斯拉汽车将会在年底前交付
- IDEA配置-无法读取src/java/main下hbm.xml等资源文件
- 探索社群系统ThinkSNS品牌10周年!
- windows10程序员计算机,Win10计算器程序员模式如何移位?
- PLSQL 的安装与简单使用
- 报错解决:DataLossError: Unable to open table file Data loss: not an sstable (bad magic number):
- 关于前端直播(videoJS与百度云web播放器:Cyberplayer3.0试用)
- 超详细MySQL安装教程(Windows)
- Tomcat高级配置(应用场景总结及示例)
- 降采样,过采样,欠采样,子采样,下采样
- Hey Future!
- 关于UCOS任务卡死的原因分析
- Charles安装以及环境搭建