Chapter 4. Using simon

下面的章节将会描述如何使用simon。

Simon主窗口

Simon主窗口的主工具栏提供了simon大多数特性的快速访问。下面列出了9种主要的功能:

1. 该菜单项具有几种状态

a. 链接(Connect):

当simon没有链接到simond时,选项呈现链接(“Connect”)。当激活时,simon开始链接到simond,并改变到链接中(“Connecting”)状态。

当第一次连接到服务器时,可能会弹出需要用户名密码。如果你还没有这样做,在继续之前,为simon设置一个用户名(参照simond manual详细信息),并且在登录弹出时输入同样的用户名密码。如果你选择了保持密码,你仍然可以在任何时候进入服务器配置(server configuration)改变它。

b. 链接中(“Connecting”)

当simon正在连接配置的simond服务器时,选项呈现链接中(“Connecting”),且按下状态。当激活后,simon将停止尝试连接simond,且回到链接(“Connect”)状态。

c. 激活(“Actived”)

当simon建立一个连接到服务器时,选项呈现激活(“Active”),但不会呈现按下状态。当激活后(或simon被配置为在可用时自动启动识别),simon尝试启动识别系统。

一个用于关闭到simond链接的选项可用,通过它后面的小向下的箭头。

d. 已经激活(Actived)

当simon建立了一个到服务器的链接并且可用时,选项呈现激活(“Actived”),且是按下状态。当simon激活后,将会退出识别系统的激活,但没有关闭simond的链接 - 它将回退到前一激活(“Activate”)状态。

2. 添加单词

显示为“add word wizard”。

3. 词汇

显示为“vocabulary”。

4. 语法

显示为“grammar”。

5. 训练

显示为“training”。

6. 命令

显示为“commands”。

7. 同步

当连接到simond时,该选项可用。

Simon创建语言输入文件,它会被编译,然后被simond服务器使用(查看架构章节来获取详细信息)。

发送语音文件、编译它们和接收编译版本的进程称为“同步(synchronization)”。默认情况下,simon会在连接建立后马上初始化同步,而不管模型是否改变(请查看configure synchronization section获取更多的信息来改变)。

使用该菜单同步可以在任何时候手动触发。

8. 场景选择

该选项允许你选择当前呈现的场景。每个子部分(词汇、语法、命令、训练)将会适用于当前显示的场景。在这儿选择一个不同的场景不会影响识别系统。

9. 管理场景

显示为“scenario management dialog”。你可以管理你的场景,并改变场景选择箱中的内容。

设置一个工作的simon需要的资源

注意:关于语言模型的详细信息,请参照概述章节的 语音识别系统:背景。

为了让simon识别语音并交互,你需要一个语音模型。

语音模型描述了你的声音听起来怎么样,存在什么单词,它们听起来怎么样,是由什么单词组合(句子或结构)存在。

一个语音模型基本包含了2部分:

语言模型:描述了所有存在的单词,什么样的句子语法是怎么样的。

语音模型:描述单词听起来怎么样。

你需要这2种组件来识别你的声音。

语言模型

大多数情况下你只需要针对你使用的情况来为你的语言模型安装合适的场景。

为了创建你自己的语言模型,你可以使用add/edit/remove单词和语法结构。

为了使添加单词更加简单,你可以导入一个shadow dictionary。

语言模型

为了创建自己的语言模型,你可以简单的进行几次读出你选择场景下的训练文本。

如果你创建你自己的场景,你只需要简单的创建自己的训练文本。

你可以使用静态或适应基础模型来避免使用HTK,或改善你的识别比率。

首次运行向导

第一次运行simon,向导会引导你配置simon的初始化。

配置包含了5个简单的步骤。你可以跳过每一步或者整个向导 - 那种情况下,系统将会使用默认值来设置。

场景(Scenarios)

这步你可以从因特网下载场景,并导入simon。

选择Get scenarios打开下载弹窗口。

如果你在这儿导入场景(或者在后面的场景管理弹出窗),你不需要设置词汇、语法、命令等。对于你自己,特别是新用户,推荐首先尝试一些场景,看看系统是怎么工作的,然后再根据你的情况分别配置。

基础模型

这步你可以设置基础模型

配置也和基础模型使用中显示的是同一页面。

在完成或丢弃首次向导,你可以在simon配置中改变配置的选项。

服务器

实际上,simon是一个服务器/客户端应用程序。如果你想尝试基于网络的安装,你可以提供一个服务器地址。

默认配置对于一个“常规(normal)”安装是非常有效的,并且假设你安装了一个本地服务器,它将自动的随simon启动和停止。

声音配置

由于simon通过一个或多个麦克风来识别声音,你需要告诉simon使用哪个设备来识别和训练。

Simon可以使用一个或多个输出设备用于多个任务。你可以在simon声音配置中找到多设备能力的更多信息。

如果你不设置一个输入设备为识别系统使用,你将不能激活simon。

如果选中了Default to power training,当训练时,simon会自动启动和停止录音。这个选项只设置了选项的默认值,用户可以在录音前手动设置当前会话。

音量校准

为了使simon正确工作,你需要将你的麦克风调整到一个敏感的水平。

关于这些的详细信息,请参照指导原则章的音量校准节。

场景(Scenarios)

本节描述了如何在simon中使用场景,对于场景的通用信息,请参照背景章节。

使用场景

从0.3版本的simon开始,你添加的每个单词都会添加到当前激活的场景。这同样适用于语法句子、命令等。

对每个simon都带有一个名为“标准(Standard)”的空场景,因此,你的配置将被保持到该场景。

为了选择哪个当前激活的场景被改变(比如在你添加新单词前)。

管理场景

场景管理弹出窗允许你从场景库中加载场景,或导入场景文件,或从网上场景库中导入。

添加一个新的场景

添加一个新场景,选择Add按钮,一个新窗口将弹出。

当创建一个新的场景,请给定一个描述名称。为了上传到后面的KDE文件,我们会要求你遵循一个特定的命名规范,尽管它不是一个要求:"[<language>/<base model>] <name>"。比如,你创建了一个英语的场景,它基于Voxforge基础模型,用于控制Mozilla Firefox,那么应该是:"[EN/VF] Firefox"。如果你的场景不是针对特定的因素集(基础模型),只需要忽略第二个标签,像这样:"[EN] Firefox"。

场景版本只是一个内部版本,用于区别一个场景区分不同的版本。

如果你的场景需要使用simon的一些指定的特性(比如因为你要使用一个新的插件),你可以定义一个最小和最大的版本号。

你的场景的证书可以通过下拉框选择,当然,你也可以通过输入框添加一个任意的证书。

同时,你还需要添加其他信息,比如作者、联系信息等。

编辑场景

在“管理场景”弹窗口中点击编辑按钮,它的窗口和添加相同。

删除场景

为了删除一个场景,选择该场景,并点击“删除”按键。

因为场景是和识别服务器同步,你可以通过模型同步备份来还原场景。

导入场景

场景可以从本地文件导入到simonXML场景文件格式,但同时也可以从因特网下载。可以从KDE-file.rog下载。

如果你创建了一个场景,可能对其他用户有用,请上传到在线库,用于帮助其他simon用户。

导出场景

场景可以被导出到本地文件,以XML场景文件的格式,也可以直接上传到在线KDE-files.org。

为了上传场景,你需要一个账户,注册非常简单且免费。Simon允许你上传新内容,直接通过(Export->Publish)。

为了使用该功能,你只需要添加你的账户到simon配置的social desktop configuration。

基础模型

本节描述了如何在simon中使用基础模型。

为了配置simon使用基础模型,简单的选择基础,并simon配置中指向有效的文件:Settings > Configure simon > Model Settings。

通过点击相应的“Load”按钮来加载文件,这个文件会被复制到内部地址,因此,源文件可以在加载后删除。

对于静态模型,你不需要macros或stats,但simon编译(即使在生成静态语言模型时都需要)不能没有它们。如果你的基础模型没有提供它们,你可以指向一个空文件替代。

simon手册翻译_part2相关推荐

  1. simon手册翻译_part1

    Chapter 1.Introduction simon是simon开源语音识别解决方案的主要前端. 它是一个simond客户端, 并且提供一个图形用户界面来管理.而且,simon能够执行各种基于从服 ...

  2. TypeScript手册翻译系列4-模块

    为什么80%的码农都做不了架构师?>>>    模块 在TypeScript中利用模块(module)来组织代码.这里将讨论内部和外部模块,以及在何时使用哪种方式更合适,以及怎么使用 ...

  3. tcpprep man 手册翻译

    TCPPREP(1)                                     Programmer's Manual                                   ...

  4. HCPL3120手册翻译

    HCPL3120手册翻译 首先HCPL3120是一个2.5A电流输出的IGBT门极驱动光电耦合器. Description: HCPL3120包含一个磷砷化镓的发光LED,该LED被光电耦合于一个带有 ...

  5. PhysX官方手册翻译

    PhysX官方手册翻译 本人水平有限,翻译中如果出现比较恶的句子...大家一定要查阅原文. 更新:2008-7-1   22:22  Raycasting(射线查询) 更新:2008-6-26 23: ...

  6. netopeer-manager手册翻译

    netopeer-manager(1)手册翻译 名字 netopeer-manager 对netopeer-server的模块管理 概述 netopeer-manager [–help] [ ] 描述 ...

  7. 20050620 GNU Bison 中文手册翻译完成

    20050620 GNU Bison 中文手册翻译完成 GNU Bison实际上是使用最广泛的Yacc-like分析器生成器,使用它可以生成解释器,编译器,协议实现等多种程序. 它不但与Yacc兼容还 ...

  8. awk 4.0+ man手册翻译第一版本

    CentOS 7 上awk 4.0以上版本的man手册翻译第一版: 参考地址:http://www.cnblogs.com/wutao666/p/9732976.html 参考地址:https://w ...

  9. 关于 MATLAB2019 快速入门教程(官方手册翻译)的几点说明

    4月份的两则博文: MATLAB2019 快速入门教程(官方手册翻译)(1/4) MATLAB2019 快速入门教程(官方手册翻译)(2/4) 是写在我尚未找到 MATLAB 中文文档时翻译的,现在我 ...

最新文章

  1. 网站建设不曾止步,持续优化才有未来!
  2. 数据结构——二叉树的递归算法
  3. leetcode 978. 最长湍流子数组(滑动窗口)
  4. 嵌入式杂谈之makefile补充
  5. 【kafka】kafka Producer Metadata概述及源码分析
  6. 关于音乐中气息的练习
  7. 敏捷开发系列学习总结(7)——敏捷开发的10大指导原则
  8. 27.MySQL Status
  9. Logisim元件用法详解一:Wiring 线
  10. 方正台式计算机初始bios密码,方正电脑刷BIOS的方法
  11. 安装mp4,mp3等媒体解码器
  12. TranslateAnimation详解
  13. Git基础-git恢复被删除的文件
  14. 服务器共享文件夹给广域网,广域网文件共享服务器
  15. Hubble数据库x某股份制商业银行:一款混布数据库的“交易+分析”提速之路
  16. 助力低碳出行 | 基于ACM32 MCU的电动滑板车方案
  17. Java核心技术卷一 -第九章:集合
  18. 作为菜鸟的我,努力学编程就对了——初来乍到篇
  19. 阿里云centos6静默安装oracle11G
  20. 去哪儿网支付系统架构演进--转

热门文章

  1. MACOS 苹果系统 微信多开
  2. ppi协议源码 c语言,西门子PPI通讯协议
  3. 布考斯基样样干_查尔斯·布考斯基经典语录
  4. 关于Arista DCS 7048交换机不支持ECN功能的说明
  5. SEO优化是什么意思,如何理解并学好它
  6. LeetCode-1758-生成交替二进制字符串的最少操作数
  7. IDA*算法实现的数字拼图游戏
  8. 大数据信息资料采集:阿里巴巴1688电商网站货源产品信息采集
  9. 初识二维码 第二讲 二维码的结构
  10. 爬虫速成(一):前言