【学习技巧和心得】 - 如何将学习资源转化成图文笔记?
一、将音视频转换为图片和文字的意义
1.1 学习资源的呈现形式无非3种,图文型、音频型、视频型
1.2 图文型的优势非常明显
- 最容易保存(占内存小,且不容易失真)
- 最方便学后调用(音频和视频没办法像图文那样存在目录,翻到哪一页明确指出,甚至在互联网上存在的图文设置的超链接、标签等工具使学后调用更加方便)
- 最便于随时随地浏览(很多人讨厌微信中对方发语音,因为没有图文方便)
- 最便于提取-修改-归纳和整合(源视频、音频如果有需要补充或修改、归纳整合的地方,直接用音频、视频形式去进行肯定效率低,因为涉及到复杂难用的音视频编辑软件,另外很多人在制作音频、视频的时候会先打一份图文型的草稿,这也间接说明图文才是根基)
- 最便于分享(一是内存小,传输快,二是因为图文容易被复制粘贴等动作提取)
- 虽然这样,但是图文型也有其缺点,没有声音就少了一份情绪,更容易让人感觉到枯燥
1.3 音频和视频的优势与劣势
- 视频的优势,特别是视频,看视频学习肯定是最不容易打瞌睡和最不需要注意力的学习方式了!因为它对大脑刺激性最强
- 音频的优势,有些场合我们的眼睛需要干其他事,但是这时候耳朵是闲着的,为了不让耳朵闲着,不妨听听书、听听知乎live、喜马拉雅等音频进行学习
- 两者的劣势,不容易修改,不容易保存,总之图文型的优势对应的反面他们全有
有些人学习完习惯性地做学习笔记,这样有很多优点比如便于分享,学习更加深刻不容易忘等(当然缺点就是费时费精力,有得就要舍)
但是在音视频学习过程中很可能没办法用短短几个字概括,就算能概括,概括出来的东西很容易偏离原意,从而不准确;这时候我们可能就需要针对性地对一些概括时容易出现偏差的学习材料进行转换,把它们基本不变地转成图文显示的形式
二、音频转文字的方法
- 如图
三、视频转文字的方法
最不推荐的方法:视频一边放,一边手抄。
如果视频有软字幕,就可以直接提取出文本——“软字幕提取法”。
3.1 什么是软字幕?
软字幕包括内封字幕、封装字幕、外挂字幕(有些地方把外挂字幕单独列出一个概念,即字幕包括软x,硬x,外挂x)。
对于外挂字幕,直接打开就可查看里面的文本,就不详述了。
3.2 如何提取“软字幕”?
来源:字幕翻译笔记:如何提取视频中的硬字幕? - 知乎
内封字幕的提取
对于mkv格式
- 法1,MKVExtractGUI2或gmkvextractgui
- 法2,Batch Subtitles Converter
对于MP4格式
- 法1,直接用My MP4Box GUI提取
- 法2,使用mkvtoolnix软件中的封装工具mmg(mkvmergegui)封装成mkv,再用mkvextractgui2提取
- 字幕转成文本
- 用以上的方法生成字幕时,会附带我们不需要的时间轴,如何把srt转成无时间轴的txt呢?
- ultra edit 的宏功能。
- Alt + C 选择时间轴,然后删除。再按Alt + C 即可。
3.3 如何提取“硬字幕”?
如果视频显示有字幕,但是“不软”,就更为艰难了
- 基于OCR的硬字幕提取法
本主题仅介绍需要后续使用OCR软件将图片转成文字的方法- 来源
- 字幕翻译笔记:如何提取视频中的硬字幕? - 知乎字幕翻译笔记:如何提取视频中的硬字幕?
- “esrxp手抄字幕”文档
- 概念
- 硬字幕又叫内嵌字幕、内置字幕。
- 硬字幕的提取方法总体分为OCR识别法,语音识别法,深度学习识别法(本质也属于OCR识别吧?不过可能深度学习识别更复杂)。
- OCR识别法,适合硬字幕,并且字幕清晰、背景杂色少的情形。
- esrxp字幕提取工具
- 本质为OCR识别法,原理是HSL色彩模型
- 利用esrxp提取出视频字幕图像,然后再利用OCR工具将其识别成文字,详见“esrxp手抄字幕”文档
- VideoSubFinder 字幕提取工具
- 本质为OCR识别法,相比esrxp,该方法要简单不少,但是esrxp的过滤器设置玩熟练了也非常好用!总之就是esrxp相比其更专业,入门难
- 线上教程
- 【字幕学习教程】使用VideoSubFinder/esrXP提取硬字幕_哔哩哔哩_bilibili【字幕学习教程】使用VideoSubFinder/esrXP提取硬字幕
- 黑科技软件使用06-视频硬字幕提取方法(使用VideoSubFinder/esrXP提取硬字幕) - 雨后观山色 - 博客园视频硬字幕提取方法(使用VideoSubFinder/esrXP提取硬字幕)
- 教程与安装包下载链接
- 链接:百度网盘 请输入提取码
- 提取码:mcey
- 来源
3.4 无字幕提取法
如果视频没显示字幕,就更为艰难了
3.4.1 基于离线语音识别转换的无字幕提取法
当视频没有字幕显示在画面上时,只能用语音识别法,适合讲话者吐字清晰、字正腔圆的情形
方法1,将视频转成音频,即提取出视频中的音频后,用语音转文字工具
方法2,直接用音视频转文字工具。
- 【网页端】牛片网(可提取出文字和时间轴)
- 工具网址 牛片智能字幕-srt字幕一键生成-字幕批量制作软件-pr字幕在线制作工具
- 使用教程 收藏 | 智能字幕V2.0版本来啦!免费!30秒音频转字幕 - 知乎
- 【网页端】网易见外工作台(可提取出文字和时间轴)
- 【网页端】爱幕(自动识别加字幕功能)
- 【网页端】云猫转码-智能字幕
- 官网:https://yunmaovideo.com/add-subtitle
- 【网页端】字幕酱
- 官网:字幕酱 - 在线字幕生成工具
- 优点是60秒内视频免费生成字幕
- 同时支持支持识别中文、粤语、英文、日语、法语、韩语、俄语、阿拉伯语、德语、西班牙语,还可以翻译后导出双语字幕
- 价格的话如下,充值的越多越便宜,差不多1分钟需要消耗0.8点
- 【网页端】&【电脑端】科大讯飞-听见字幕
- 本质为语音识别法
- 官网:讯飞听见字幕-视频字幕生成软件|自动识别语音给视频加字幕
- 需要付费,机器识别字幕收费标准如下
- 【电脑端】剪映(Win/安卓/iOS)
- 胡萝卜周-快速给视频加字幕,你可能需要这个技巧
- 仅导出字幕文件的方法
- 字幕是识别出来了,但是呢,剪映要去修改文本是比较麻烦的,而且不支持直接导出识别好的字幕文件。
- 为了能够使识别的字幕文件导出来,就有吾爱论坛成员开发了一款将剪映字幕导出的工具,通过这款工具可以直接导出srt字幕格式,srt字幕格式就可以直接导入PR、会声会影、万兴喵影等,这样的话就更加方便编辑修改。
- 另外,有一个「抠像」的笨方法:假设你用的是PR,那就是先用纯绿色对视频进行填充,导出一个绿幕视频 » 利用剪映自动识别生成字幕并导出视频 » 在PR中导入视频并抠像(PR中抠像的方法是效果-超级键-效果控件-主要颜色)
- 那么,具体如何使用?
- 在剪映成功识别文字之后,打开这款字幕导出工具,接着点击解析,会自动识别到剪映生成的json文件,点击进入选择draft.json。(如果找不到draft.json文件,可以直接在C盘搜索,如何直接拖拽进解析界面)
- 这样就解析出来了所有的字幕,最后就是选择导出,就可以直接生成srt字幕格式的文件。
- 有了srt字幕格式的文件,导入PR软件之后就可以非常方便的编辑了,可以全选修改字体、大小、颜色等等,有错别字也可以直接修改。
- 【电脑端】人人译视界(Win/Mac)
- 官网:人人译视界-精彩不因语言而阻碍
- 在软件中打开视频,并点击AI听译,选择要识别的语言后耐心等待即可,软件需要把视频上传到云端进行字幕识别与生成
- 支持中文、英语、日语、韩语、法语、俄语、西班牙语、德语...等40种语言的AI听译,部分语种还支持口音(如美式英语、广东话等)
- 有个特点功能:可以识别画面中已有的字幕,意味着可以用来提取视频字幕
- 价格上而言,是阿虚所知的自动生成字幕工具中最贵的,除非是对小语种有字幕自动生成有需求,不然不太推荐
- 【电脑端】小象字幕生成(可提取出文字和时间轴)
- 网址 小象字幕生成
- 【电脑端】Videosrt(Win/Linux)
- Github地址:GitHub - wxbool/video-srt-windows: 这是一个可以识别视频语音自动生成字幕SRT文件的开源 Windows-GUI 软件工具。
- VideoSrt 是一款开源免费软件,但本身并不提供服务,而是需要自己手动申请并填写第三方公共云服务接口,配置好之后才可使用;其中生成字幕所用到的是阿里云的语音引擎,试用版每日提供2小时的免费额度,远够个人使用
- 这款软件的优势是可以生成双语字幕,输入输出语言支持:中文、英语、日语、韩语、法语、德语、西班牙语、俄语、意大利语、泰语
- 当然想生成双语字幕的话,就得额外申请翻译API了(百度 or 腾讯),好在作者都在使用指南中给出了详细的视频配置教程
- 【电脑端】深度学习法提取字幕(可提取出文字和时间轴)
- 来源网址
- 视频硬字幕提取 基于深度学习 一键操作_哔哩哔哩_bilibili 视频硬字幕提取 基于深度学习 一键操作
- 开发者使用Mac开发的,因此要用win10使用,必须配置相当复杂的环境
- 不过开发者有将其图形化的想法,后面再等其更新吧
- 下面是GitHub链接GitHub - YaoFANGUK/video-subtitle-extractor: 视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files.
- 【电脑端】ArcTime Pro(Win/Mac/Linux)
- 官网:ArcTime Pro跨平台字幕软件 | Arctime字幕软件
- ArcTime 是一款知名字幕工具,在不久前作者更新了自动语音转写+打轴功能等功能
- 价格比讯飞便宜不少,新用户非常便宜,差不多0.15元/分钟
- 支持普通话、粤语、英语;可以无缝支持所有主流非编软件是一大优势
- 同时作为一款常用的字幕工具,就算不使用这个自动生成字幕,单纯用来手工加字幕,也是一个非常不错的选择
- 【手机端APP】录音转文字助手(只能提取出文字)
- 【手机端微信小程序】“微转写”
3.4.2 基于在线语音识别的字幕提取法
详见我的另一篇文章
【上网技巧】 - 如何在播放视频的时候显示「实时字幕」呢?_dssgresadfsrgre的博客-CSDN博客
四、注意事项
视频转文字一定要注意信息失真的问题。有些教学视频在讲述的过程中,讲师不一定把所有的细节说出来,而是有些地方让你自己看这个PPT,所以单纯地使用OCR识别字幕或语音识别生成文字,信息失真度会比较高。
所以建议最好在转换之前先观看一遍视频,然后把那些没办法OCR识别/语音识别的部分截图下来,等到时候整理成文字的时候再借此补充细节。
【学习技巧和心得】 - 如何将学习资源转化成图文笔记?相关推荐
- 学习java的心得体会_学习java的心得体会范文.doc
学习java的心得体会范文 篇一:JAVA学习的心得体会 ? 国家队每一次踢球失败后都要说这么一句:我们回去后要好好总结,下次会打得更好! ? 总结不代表就能改过原有的不足,也不代表就能进步了 ? ( ...
- 使用卷积神经网络(普通CNN和改进型LeNet)以及数据增强和迁移学习技巧识别猫和狗,并制作成分类器软件(基于Keras)
数据集:https://www.microsoft.com/en-us/download/confirmation.aspx?id=54765 猫和狗的图片各自有12500张. 第一步 整理数据集,查 ...
- 学习5g通信心得体会_5G学习笔记 - 运营商·运营人 - 通信人家园 - Powered by C114...
随着5G的到来,最近也参加了相关的学习,以便迎接更契合的通信发展契机,现把笔记整理整理. 从通讯能力上来说,5G技术有三大特点.第一个是传输速率更高.4G的传输速率大约是百兆比特每秒(bit/s),5 ...
- 高效办公之高效学习技巧:倍速学习软件详解
高效学习技巧 1.倍速学习软件 - VLC/KMplayer教学 KMplayer教学 VLC教学 2.课程相关资源 1.倍速学习软件 - VLC/KMplayer教学 如果说我有什么学习的方法的话, ...
- [BOST] 博赞有机的学习技巧
博赞有机的学习技巧 BOST分为两大主要策略:准备和应用 BOST:准备 主要包括: 浏览.时间与任务量.5分钟思维导图练习.提问与确定目标. 浏览 在开始工作的时候先浏览一下要学习的教材是很重要的, ...
- Eclipse IDE 使用技巧 (Eclipse工作空间小技巧)(自己的一些学习笔记和心得,记录下来,备忘录和复习使用)
雪豹软件工作室推出了原创免费的java视频教程,关注我们的公众号就可以看到原创免费java视频教程的百度云盘下载链接啦,或者在公众号中给我们留言! 如果喜欢我们的小伙伴请关注我们的公众号哈!下面的这张 ...
- 医用计算机基础学习心得,计算机基础学习心得.doc
计算机基础学习心得 计算机基础学习心得一:计算机基础学习心得 当今社会,到处充满机会与挑战.知识是我们面对这一切的筹码,而计算机知识则更为重要.如何在本科函授这样一种形式下,学好计算机课程,这是摆在我 ...
- 计算机未来就业讲座心得体会,计算机学习心得体会范文(精选3篇)
计算机学习心得体会范文(精选3篇) 当我们经过反思,对生活有了新的看法时,将其记录在心得体会里,让自己铭记于心,这么做能够提升我们的书面表达能力.那么你知道心得体会如何写吗?下面是小编收集整理的计算机 ...
- 大学生专业计算机培训心得,计算机专业学习心得体会800字
计算机的应用在中国越来越普遍,改革开放以后,中国计算机用户的数量不断攀升,应用水平不断提高,特别是互联网.通信.多媒体等领域的应用取得了不错的成绩.下面是小编带来的有关计算器专业学习心得体会,希望大家 ...
- 大一大学计算机心得,大一计算机学习心得感悟
大一的时候有计算机的课程学习,计算机课程激起了学习兴趣了,里面有很多知识可以学习,所以要不断的努力咯.下面是学习啦小编为大家收集整理的大一计算机学习心得感悟,欢迎大家阅读. 大一计算机学习心得感悟篇1 ...
最新文章
- pybind 播放h264
- 用Python对数学函数进行求值、求偏导
- java中双引号和单引号_Java中的单引号和双引号之间有区别吗?
- js 获取URL参数乱码解决
- proc文件系统面面谈(转贴)
- ubuntu下针对php的thrift 安装折腾记录
- 在Winform开发框架中实现对数据库的加密支持(转)
- android studio程序开机启动,Android Studio中创建和启动AVD【Android】
- 关于Kindle的生词提示功能不显示
- html怎么把图片左移_html元素向左移代码 html
- 使用较广泛的安全测试工具有哪些?
- Markdown语法手册
- Python split()函数的用法
- Python 爬虫 | 获取历史涨停数据
- 多媒体计算机设计原则,多媒体课件的设计原则
- 感受山猫之力 Ubuntu 10.04 LTS试用手记
- SRS搭建流媒体服务器
- [论文研读]天天看到的 ground truth,到底是什么意思?
- 产业分析:平台经济是什么
- SpO2、SaO2、PaO2、低氧血症概念及标准的总结
热门文章
- ZEMAX | 如何创建复杂的非序列物体
- DHCP八种报文及其详解
- 【springmvc+mybatis项目实战】杰信商贸-29.购销合同技术难点分析
- 关于射频同轴连接器的功率容量探讨
- 冷热分离和直接使用大数据库_【TBase开源版测评】深度测评TBase的shard分片和冷热分离存储特性...
- lync 2013标准版安装
- Linux 查看日志命令tail的用法
- 计算机控制系统编程语言有哪些,PLC编程语言有哪些种类
- 嵌入式软件工程师笔试面试指南目录
- 计算机应用技术5g通信,浅谈5g网络通信技术【浅谈多媒体通信技术的应用】