通过阅读剧本或者字幕来练习口语是一个有趣且高效的方法,我选择的是瑞克和莫蒂,下文记录一下全过程。

一、选它的理由:

1、对话密集,短对话多

这点很重要,因为这是练习口语的需要。我并不想向过去一样背诵新概念或者是长篇的英文课文,所以排除叙述性太强的例如BBC或者英文纪录片。

有一些剧的特点是人物都比较高冷,对话不多,而我希望在我一集一集的练习时间中人物最好无时无刻不再说话,这样 瑞克和莫蒂 每集二十分钟的连贯对话就是非常好的选择。当然如 老友记 或者其他比较生活化的剧集也十分不错。

2、故事性强,可以N刷

要拿一部剧的剧本来作为练习素材,喜欢这部剧是非常重要的。最好是平常都有n刷的剧再好不过。在通读完字幕后再刷完全可以找生肉练习听力。

二、如何获取字幕文件

1、字幕库直接搜索

字幕库
这个网站的字幕我感觉是比较齐全的了,可以看到上面的字幕文件,有以下两种,.srt就是从MKV视频中提取出来的字幕格式,.ass是外挂字幕的格式。

.srt格式如下:

.ass格式如下:

我后续所有的字幕文件都使用的是.srt格式的,因为.srt的格式比较方便写个脚本处理,而且.ass文件可以从网页上一键转换成.srt文件。
字幕格式转换

2、从mkv格式视频中抓取字幕

即便是上面提到的字幕库,在上面搜索瑞克和莫蒂也缺少第三季的字幕素材(现在我已经上传)。遇到这种情况,就需要从mkv视频中抓取字幕。

1)下载mkvtoolnix,

2)打开MKVExtractGUI.2.3.0.0.简体汉化版

拖入要处理的视频,就可以看到如下分轨,即可提取出字幕文件和音频文件。
ps:如果没有MKVExtractGUI.2这个软件需要单独下载然后拖入mkvtoolnix的文件夹。
pps:当然只需要音频文件的不用这么麻烦,任意格式视频和格式工厂就可以搞定。

三、如何处理字幕文件

1、去掉字幕文件中的帧数、时间轴和空行

由于我也是初次使用python,所以这个小脚本可能写得不太好,但是可以用,每一步骤我都尽力标注了一下方便后面修改:

import os
import re
import numpy as nppath = os.getcwd()         # 定位到当前地址
name = 0
for h in os.listdir(path):if re.match('.*.srt', h):  #匹配剧本文件name = name + 1orifile = open ( h ,'r+') #encoding取决于文档编码格式insfile = open (str(name) + '.txt' , 'w+') #由于这里原文档编码格式不同的话写入会乱码,所以建立临时文档#outfile = open ('S03','a')  #都输出到同一个文档内if name < 10:outfile = open ('S03E0' + str(name) + '.txt','a')else:outfile = open('S03E' + str(name) + '.txt', 'a')content = orifile.read()insfile.seek(0,0)insfile.write('\n'+content)#locate = re.search('1',content) #当文档前有多行空行时需要定位,一般不用#coordinate = locate.start() - 1#insfile.seek(coordinate,0)insfile.seek(0, 0)i = 0                #每隔固定行输出一行j = 0                #多行错误for line in insfile.readlines():if line != '\n'  and j == 1: #空行'\n' #当前帧多行i = i - 1print(line)      #检查多行错误,有必要要的继续加进去print(h)#outfile.write(line)j = 0i = i + 1if i == 5 :  #每隔固定行输出一行if line != '\n': #避免少行错误outfile.write(line)i = 0j = 1     #避免多行错误else:        #当前帧少行i = 1j = 0    

2、在word中录制宏来统一处理格式

这里我就不赘述了。

四、进行口语练习

通过上述的方法可以抓取其他你喜欢的剧集的字幕和音频。
现在拿到了剧本和音频,就可以跟读,角色扮演来练习口语,我的建议是把剧本打印出来,开通一个喜马拉雅或者其他FM的主播号,将音频做成专辑传上去,在实际练习时比较好控制进度条,语速,尤其是这种听书软件的+15s,-15s设计很好控制播放进度。需要注意的是版权问题,一定要上传成私密专辑。

如何将瑞克和莫蒂的字幕和音频抓下来练习口语相关推荐

  1. 瑞克·李特的追寻 正是我们所需要做的!中国

    瑞克·李特的追寻 别人放弃,自己还是坚持:他人后退,自己还是向前:眼前没光明.希望,自己还是努力奋斗.这种精神,是一切科学家.发明家及其他有大成就的人物成功之原因. --马尔腾 凌晨5点,瑞克·李特开 ...

  2. FITC/ICG/TMR/HRP/Cy3荧光标记阿法替尼/阿西替尼/克里唑蒂尼/奥拉帕尼/Lenvatinib/多韦替尼 等药物

    异硫氰酸荧光素(FITC)标记 异硫氰酸荧光素(FITC)具有永久性标记生物分子的独特检测性能,可用于检测或跟踪共轭物与其他生物分子的相互作用.FITC是荧光素的异硫氰酸酯衍生物,主要通过对其5-碳位 ...

  3. 做游戏,学编程(C语言) 18 瑞克快跑

    分享16级同学大一上学期实现的瑞克快跑,它是一款跑酷游戏,目标是躲避障碍物.取得高分.分步骤代码.可执行程序.录屏效果可以从百度网盘下载:http://pan.baidu.com/s/1bpNAwoB ...

  4. 固瑞克机器人电焊密封胶胶枪枪嘴_胶枪的使用方法

    作为国产货的典型代表,小米在近几年来也是突飞猛进的发展,不仅致力于手机领域,在净水机和空气净化器领域也有一定的发展,尤其是小米净水机,可以说现在很多消费者都会首先考虑,那么小米净水机的安装知识您了解吗 ...

  5. 瑞芯微RV1126使用官方sdk进行音频编码

    记录一下在使用1126进行音频编码中遇到的一个问题,根据官方文档:Rockchip RKMedia Development Guide 参考sdk目录external/rkmedia/examples ...

  6. framer x使用教程_如何使用Framer Motion将交互式动画和页面过渡添加到Next.js Web应用程序

    framer x使用教程 The web is vast and it's full of static websites and apps. But just because those apps ...

  7. python自动生成鸡汤文_20行python代码实现鸡汤智能生成器

    "Don't think of the overwhelming majority of the impossible." "不要去想不可能之事" " ...

  8. 个人项目api接口_5个免费有趣的API,可用于学习个人项目等

    个人项目api接口 Public APIs are awesome! 公共API很棒! There are over 50 pieces covering APIs on just the Towar ...

  9. python 随机名言_如何用简易代码自动生成经典语录

    "不要空想不可能的事情" "增加自己的幸福感" "我们最终将创造地面,并呵护它" "保持希望并学会放弃奇迹" 上面所有引 ...

最新文章

  1. Git fetch和git pull的区别
  2. 如果地府需要一个后台管理系统,你会如何设计?
  3. Linux下实现多网卡绑定
  4. LeetCode Kth Largest Element in an Array(小根堆)
  5. Android之如何解决刚下载的Android studio(包括上面的菜单栏)乱码问题
  6. C++之泛型编程(模板)
  7. java 执行顺序_Java代码执行顺序
  8. 马斯克:大量特斯拉汽车将会在年底前交付
  9. IDEA配置-无法读取src/java/main下hbm.xml等资源文件
  10. 探索社群系统ThinkSNS品牌10周年!
  11. windows10程序员计算机,Win10计算器程序员模式如何移位?
  12. PLSQL 的安装与简单使用
  13. 报错解决:DataLossError: Unable to open table file Data loss: not an sstable (bad magic number):
  14. 关于前端直播(videoJS与百度云web播放器:Cyberplayer3.0试用)
  15. 超详细MySQL安装教程(Windows)
  16. Tomcat高级配置(应用场景总结及示例)
  17. 降采样,过采样,欠采样,子采样,下采样
  18. Hey Future!
  19. 关于UCOS任务卡死的原因分析
  20. Charles安装以及环境搭建

热门文章

  1. WRF namelist.input记录
  2. OpenWRT系统(二) - LoRa基站开发
  3. eclipse-jee配置jsp开发环境
  4. 示波器的三种触发模式详解
  5. EV SSL证书是什么意思?
  6. 河海大学计算机科学高考分数,河海大学2019年各省各专业录取分数线
  7. CAS:295348-87-7_AF594 NHS 活化酯_ Alexa Fluor 594 NHS ester
  8. SAP:FI 会计基础知识
  9. 大话 Android RecycleView 源码
  10. 传奇大神何恺明被曝回归学界,网友:要成全MIT引用最高的人了