ai自动生成字幕

Many people rely on captions every day. Unfortunately, not everything has captions; this often includes simple things, like that webinar you’re attending, or more advanced systems like Mozilla Hubs. Recently, I discovered Otter.ai, which offers AI-based live transcription. It’s not perfect, but it works about as well as most live TV broadcasts if you hook it up correctly. I’d still recommend pre-recorded videos should have human-corrected caption files, but not all live systems support captioning. Hopefully, this guide will help you hook up a bit of a stop-gap solution for those cases. Here we’ll look at captioning Mozilla Hubs in Firefox. First, you’ll need to do a loopback of your audio, and you’ll need a free Otter.ai account (you can use my referral code to get a month of free premium features too).

许多人每天都依赖字幕。 不幸的是,并不是所有的东西都有字幕。 这通常包括简单的事情(例如您正在参加的网络研讨会)或更高级的系统(例如Mozilla Hubs)。 最近,我发现了Otter.ai,它提供了基于AI的实时转录。 它并不完美,但如果正确连接,它的效果与大多数直播电视广播一样。 我仍然建议预先录制的视频应具有人工校正的字幕文件,但并非所有实时系统都支持字幕。 希望本指南将帮助您为这些情况提供一些权宜之计。 在这里,我们将在Firefox中查看Mozilla Hub的字幕。 首先,您需要对音频进行回送,并且需要一个免费的Otter.ai帐户( 您也可以使用我的推荐代码来获得一个月的免费高级功能)。

Audio loopback lets you take the audio from an application, say Firefox, and make it look like a new microphone attached to your computer. This method provides a clean signal instead of just turning up your speakers and hoping your microphone acoustically gets the sound, which creates a lot of noise that tends to make AI automated speech recognition services fail fast.

音频环回使您可以从Firefox之类的应用程序中获取音频,并使它看起来像是连接到计算机的新麦克风。 这种方法提供了一个干净的信号,而不是仅仅打开扬声器并希望麦克风以声学方式获得声音,这会产生大量噪声,从而使AI自动语音识别服务快速失效。

You’ll need software to make a proper loopback. If you’re on a PC, I believe you can use LoopBeAudio. If you’re on a Unix flavor, run vi and figure it out. I’m on a Mac, so I’ll be using Loopback. You can use it for 20 minutes for free, and then it degrades your audio by adding noise. The $100 license isn’t cheap, but it works very well. If you know any better tools for Mac, PC, or Unix, let me know. When you run Loopback, you’ll see a little flow chart for the audio.

您将需要软件进行适当的回送。 如果您在PC上,我相信您可以使用LoopBeAudio 如果您使用的是Unix,请运行vi并找出答案。 我在Mac上,因此我将使用Loopback 您可以免费使用20分钟,然后通过增加噪音来降低音频质量。 100美元的许可证并不便宜,但效果很好。 如果您知道适用于Mac,PC或Unix的任何更好的工具,请告诉我。 运行Loopback时,您会看到一些音频流程图。

You can give it a friendly name to say what it is like, “Firefox and Microphone.” Then add a source Firefox and a microphone source or whatever else you want to ‘listen’ to.

您可以给它起一个友好的名称,以表示它的名称:“ Firefox和麦克风”。 然后添加来源Firefox和麦克风来源,或者您要“监听”的其他任何来源。

A source list of inputs from Loopback.

You’ll see them pop in the flow chart.

您将在流程图中看到它们的弹出。

Loopback’s interface showing two inputs Firefox and internal Microphone.

It’s essential to turn off Mute when capturing if you want sound on the audio feed to come out the speakers. Make sure it is on in Loopback and voila!

如果要使音频源上的声音从扬声器中发出,则在捕获时关闭静音非常重要。 确保已在Loopback和voila中打开它!

Now head over to Otter.ai and sign in. You can click Record, and it will prompt you for a microphone. Select your Loopback microphone from the list.

现在转到Otter.ai并登录。您可以单击“录制”,它将提示您输入麦克风。 从列表中选择您的回送麦克风。

A browser window prompting for microphone access with the loopback device selected.

And you’re done! Anything from Firefox goes to Otter.ai.

大功告成! Firefox的所有内容都可以访问Otter.ai。

Left: Mozilla Hubs playing a video. Right: Otter.ai transcribing the Hubs room.
An embedded video in Mozilla Hubs getting live captions as a very convoluted example.
作为一个非常复杂的示例,Mozilla Hubs中的嵌入式视频获取实时字幕。

Here, I’m playing an embedded video in Mozilla Hubs in one tab. The other tab is Otter.ai listening to Firefox and transcribing! It’s not perfect, but if you have a system with no captioning support like Mozilla Hubs, Jitsi, or even Zoom, this is an excellent way to capture and caption that content. Of course, it records all the audio, so inform people you’ll be doing this in advance.

在这里,我在一个选项卡中播放Mozilla Hubs中的嵌入式视频。 另一个标签是Otter.ai,可以监听Firefox并进行转录! 它并不完美,但是如果您的系统不支持字幕,例如Mozilla Hubs,Jitsi甚至Zoom,这是捕获和字幕该内容的绝佳方法。 当然,它会记录所有音频 ,因此请提前告知人们您将这样做。

Otter.ai gives you an interface for correcting things, adding vocabulary to help it know some of your words (though acronyms like UBICOMP and UIST still confuse it), and gives you a fun keyword summary when completed. You can then export the notes as text or even an SRT for subtitles if you need them. I updated my Remote Video Presentation Guide to include more specifics if you need a timestamp caption file.

Otter.ai提供了一个纠正问题的界面,添加了词汇表以帮助它了解您的某些单词(尽管诸如UBICOMP和UIST这样的首字母缩略词仍然使它感到困惑),并在完成时为您提供了有趣的关键字摘要。 然后,您可以将注释导出为文本,甚至可以将SRT导出为字幕(如果需要)。 如果您需要时间戳说明文件,我更新了《 远程视频演示指南》以包含更多详细信息。

We can assume AI-based captioning will get better over time, though technical content is a challenge. Unfortunately, many commercial or experimental systems don’t have the proper captioning or even hooks for captions (like Otter.ai doesn’t currently have an API else I would have written it into Mozilla Hubs). Hopefully, this guide will help bridge that gap just a bit!

我们可以假设基于AI的字幕会随着时间的流逝而变得更好,尽管技术含量是一个挑战。 不幸的是,许多商业或实验系统没有适当的字幕,甚至没有字幕钩(例如Otter.ai目前没有API,否则我会将其写入Mozilla Hubs)。 希望本指南能帮助您弥补这一差距!

翻译自: https://medium.com/@ayman/use-ai-to-live-caption-your-meetings-14e4a2d2da3a

ai自动生成字幕

http://www.taodudu.cc/news/show-2971034.html

相关文章:

  • ASFG - AI可以帮你自动生成字幕文件
  • 为音视频自动生成字幕的python工具
  • 一键自动生成字幕、制作双语字幕,懒人必备
  • python自动生成字幕_自动生成字幕软件?
  • BLS签名算法
  • 密码学——elgama加解密及数字签名算法
  • 密码学系列 - 椭圆曲线签名的基本原理
  • ECDSA数字签名算法
  • 密码学数字签名
  • 现代密码学:数字签名
  • 密码学之ElGamal 数字签名 密钥产生 数字签名 验证 python实现
  • 密码学之数字签名是什么
  • 现代密码学实验5 数字签名ElGamal签名方案
  • 密码学---数字签名和认证协议---数字签名标准
  • 密码学---数字签名和认证协议---数字签名的基本概念
  • 【密码学原理】数字签名(ElGamal签名,Schnorr签名,椭圆曲线签名,RSA-PSS签名)
  • 密码学系列之七:数字签名
  • 密码学——Schnorr签名算法
  • 学习签名signature 的使用
  • 密码学系列 - 多种签名方式
  • 密码学——数字签名
  • 教我怎么写连笔字签名胡彦清
  • Python做数据处理(二):贷款风险预测
  • DataCastle用户贷款风险预测(完整数据)
  • 天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测总结
  • uci数据集中的缺失数据_从uci早期糖尿病风险预测数据集中创建分类器
  • 关于【天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测】的思考
  • 肺癌新易感位点的发现及多基因遗传评分在肺癌风险预测中的应用--基于中国超大型前瞻性队列研究
  • 一战成名,用户贷款风险预测 参赛代码与数据集分享
  • 交通事故风险预测——《TA-STAN: A Deep Spatial-Temporal Attention Learning Framework...》

ai自动生成字幕_使用AI对您的会议进行现场字幕相关推荐

  1. 写文章很难,ai自动生成文章为你来排忧

    常常听到有人说写文章难,一篇文章不知如何开头,一篇文章写了又删,删了又写,一篇文章要写几个小时等等问题,对于那些不喜欢写作的人来说,写文章确实挺难的.但是由于工作中的原因有时候又不得不写,写又写不出内 ...

  2. 使用AI自动生成PPT --- Gamma

    近期找到一个非常好用的,使用AI自动生成PPT的工具--Gamma( https://gamma.app/signup?r=7ikntzoapw5mzpo )测试几次,发现自动生成的PPT基本能够拿来 ...

  3. 【使用AI自动生成建筑立面】

    使用AI自动生成建筑立面 概述 硬件要求 软件安装 注意事项 概述 本文描述的是使用最近大火的stable diffusion神经网络的迁移学习模型ControlNet自动生成建筑立面. 项目网站:h ...

  4. 自动生成绘画怎么做?安利3个ai自动生成绘画软件

    绘画是人类表达思想.情感和美感的一种方式,而随着人工智能技术的不断发展,自动绘画技术也逐渐成为了一种热门研究领域.ai自动生成绘画软件的出现,让艺术创作变得更加有趣和多样化.这种软件能够通过学习大量的 ...

  5. html自动生成工具_关于STM32代码自动生成的工具的进度....

    前情提要:STM32代码自动生成工具_本想...但是...可是...所以 首先说一下那几天大家的反应,有的持观望态度,毕竟STM32CUBE很香:有的很激动,期待我快点出东西:还有的很淡定,知道我在挖 ...

  6. sql自动生成工具_可自动生成代码,5款基于AI的开发工具

    如今,对机器学习潜力感兴趣的程序员都在讨论,如何使用人工智能和基于人工智能的软件开发工具构建应用程序.例如PyTorch和TensorFlow之类的解决方案. 除此之外,机器学习技术正以另一种有趣的方 ...

  7. AI一键图文生成短视频工具,文章AI自动生成视频,傻瓜式操作。

    据数据统计,截止2020年12月,短视频用户约有 8.73 亿,由此可见,短视频发展潜力巨大.抓住短视频,无疑就是抓住一个流量红利.那如何制作短视频呢?可以选择文本一键生成短视频工具,简单方便! 这里 ...

  8. AI自动写文章_免费在线原创文章生成器

    自动写文章生成器 自动写文章生成器是一种利用人工智能和自然语言处理技术,帮助用户快速生成文章的工具.该软件可以根据用户的需求和选择,自动生成符合要求的文章,无需手动编写和修改. 自动写文章生成器的主要 ...

  9. ai无法启动产品_启动AI启动的三个关键教训

    ai无法启动产品 重点 (Top highlight) Let me be upfront: I was the technical co-founder of an AI startup and i ...

最新文章

  1. AC日记——[Hnoi2017]影魔 bzoj 4826
  2. JS中toFixed()方法的问题及解决方案
  3. OS- -调度(二)
  4. 输出四位完全平方数_完全平方数中的规律
  5. ajax传值 实体类_ajax传参到实体类对应字段
  6. 才博教育:AI口语学习平台上云
  7. [Linux] 解决Ubuntu12.10 64位google chrome安装Flash后出现couldn‘t load plug-in的问题;
  8. Atititjs h5调用摄像头视频聊天 拍照功能 相机功能 录像attilax总结
  9. 十进制小数转二进制用计算机操作,十进制转二进制
  10. solr java 客户端
  11. C# 单个按钮实现暂停或继续
  12. MES1.0实现分析 -制造业数字化探讨(1)
  13. 利用matlab来设计FIR滤波器参数
  14. HBuilderX配置自动格式化,统一代码规范
  15. mathematics中如何计算排列组合
  16. 六轴机器人轨迹规划之五段位置s曲线插补
  17. 软件测试职业规划(转)
  18. golang 从windows 剪切板 (剪贴板)中读取bmp图片数据的方法
  19. A - Heavy Transportation POJ - 1797
  20. 马克扎克伯格节俭_马克·扎克伯格的垃圾实在很难抢

热门文章

  1. java笔记——反射
  2. JAVA 实现字符串(String)的模糊查找
  3. OpenCV二值图像连通域分析
  4. Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Dremel
  5. nmn吃第一天有什么感觉,吃完nmn的反应,一点点体会
  6. Linux服务器硬盘故障后恢复数据的方法和数据恢复过程
  7. Linux Log文件常用命令
  8. 计算机不识别u盘咋办,电脑无法识别u盘如何修复,电脑不识别u盘怎么办
  9. 初学oracle笔记
  10. jquery3.2 在线引用地址