1. VAM语料库是从德国电视脱口秀节目“Vera am Mittag”(中午的Vera)的12小时录音中提取的。这些录音被分割成广播、对话表演和话语。视听演讲语料库包含从脱口秀嘉宾之间无脚本的真实讨论中录制的自发和情感演讲。从事自发语音分析、情感识别、语音和面部表情、自然语言理解和鲁棒语音识别的研究小组可能会对这些数据感兴趣。语言学家对数据中存在的各种德国区域口音的看法可能会产生进一步的兴趣。
  2. 情感标签:除了视听数据和分段话语之外,还为大部分数据提供情感标签。情绪标签以连续值的尺度给出三个情绪原语:价态(积极与消极),激活(平静与兴奋)和支配(弱与强)。几个人工评估人员分别进行了评估。作为一种方法,使用自我评估模型(见出版物)。
  3. VAM视频:对赌视频语料库包含12个广播(节目)的视听信号。78 个话语(5 个扬声器)的其余子集共享为 352x288 像素、25 fps 的 mpg 文件。
  4. VAM-音频:语料库的这一部分仅包含音频信号。VAM-Audio 语料库中总共包含 947 个语音。数据按 47 个独立说话人 (11m/36f) 进行组织。对于每个说话者,数据以句子的形式进行子结构。由于数据的来源,每个说话者的数据量不同:从4到46个话语。对于每个句子,提供一个 wav 文件。wav文件以16 kHz采样率和16位分辨率录制为立体声信号。情绪由几个独立的人类评估者评估:17名评估者分别用于脱口秀说话人1-19,6名评估者用于说话人20-47。提供每个评估员的评估(*.eva 文件)。此外,还提供了融合的情绪评估结果(*.ewe文件)。为了区分由大量评估员标记的第一组录音和第二组录音,建议将说话人1-19的话语称为“VAM-Audio I”,其余的称为“VAM-Audio II”。VAM 音频的文档集大小为 177 MB。
  5. VAM-face:语料库的这一部分包含 VAM 视频语料库中说话人的提取面部图像。语料库包含从 VAM 视频语料库的视听语音记录中提取的 1867 张面部图像。数据是按 20 个说话人的子集按说话人组织的。对于每个句子,提供了几个面部图像作为png文件。图像的分辨率为 352x288 像素。情感内容使用情感原始标签价态,激活和支配(*.eva文件)进行标记。此外,还给出了情感类别标签(*.cat文件)。磁盘上的文档集大小为 255 MB。
  6. 更多信息可参考以下两篇论文:
    1. https://www.sciencedirect.com/science/article/pii/S0167639307000040?via%3Dihub
    2. The Vera am Mittag German audio-visual emotional speech database | IEEE Conference Publication | IEEE Xplore

VAM语料库--学习笔记相关推荐

  1. (转载)机器学习知识点(二十九)LDA入门级学习笔记

    入门级学习笔记 1.1文本建模相关 统计文本建模的目的其实很简单:就是估算一组参数,这组参数使得整个语料库出现的概率最大.这是很简单的极大似然的思想了,就是认为观测到的样本的概率是最大的. 建模的目标 ...

  2. SDCC 2016数据库峰会(深圳站)学习笔记

    本文主要查阅了SDCC 2016数据库峰会(深圳站)PPT合集后的学习笔记,在此记录.下面的几个标题是各个PPT的文件标题. 01 金融大数据技术与实战-平安科技-王健宗 背景 3月15日,持续七天的 ...

  3. 深度学习(四十二)word2vec词向量学习笔记

    word2vec词向量学习笔记 原文地址:http://blog.csdn.net/hjimce/article/details/51564783 个人微博:黄锦池-hjimce 一.使用原版word ...

  4. python人工智能学习笔记_[Python] 人工智能与自然语言处理学习笔记(1)

    最近我参加了一个人工智能与自然语言处理的课程,这是第一周的学习笔记.这份笔记不涉及一般知识,全部都是与实践(我在这门课上的作业)有关的总结. 文章目录理论学习人工智能的五种模型:作业1. Rule B ...

  5. AI学习笔记(十五)自然语言处理基本概念

    目录 AI学习笔记之自然语言处理 自然语言处理(Natural Language Processing) 自然语言简介 自然语言处理的难点 自然语言处理的现状 基于深度学习的自然语言处理 NLP的处理 ...

  6. “领域知识图谱的构建与应用”讲座学习笔记

    知识图谱是一种基于先进信息技术的型语义工具,它以实体或概念为节点,通过语义关系连接成大规模语义网络,可以帮助机器或信息系统理解语义.组织知识.发现知识,从而为人们提供知识.情报的智慧搜索和智能交互. ...

  7. 《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第01章 语言处理与Python

    第01章 语言处理与Python 1.1 语言计算:文本和单词 Python入门 NLTK 入门 搜索文本 计数词汇 1.2 近观Python:将文本当做词链表 链表(list,也叫列表) 索引列表 ...

  8. 伯禹公益AI《动手学深度学习PyTorch版》Task 07 学习笔记

    伯禹公益AI<动手学深度学习PyTorch版>Task 07 学习笔记 Task 07:优化算法进阶:word2vec:词嵌入进阶 微信昵称:WarmIce 优化算法进阶 emmmm,讲实 ...

  9. Task02:学习笔记文本预处理;语言模型;循环神经网络基础

    Task02:学习笔记文本预处理:语言模型:循环神经网络基础 文本预处理 文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本 ...

  10. 《智能对话机器人开发实战20讲》--学习笔记--AIML基础功能拓展-与互联网的集成

    一.学习笔记 环境要求: aiml bs4 语料库: tuling.aiml search_web.aiml <that>WHICH SEARCH ENGINE WOULD YOU LIK ...

最新文章

  1. 2018-3-27 专家系统
  2. 谷歌发布新编程语言,专治SQL各种“不服”
  3. 用计算机算出90除以6.28,用计算器计算:sin51°30′+ cos49°50′-tan46°10′的值是 .——青夏教育精英家教网——...
  4. windows 域用户账号验证登陆
  5. bzoj1078【SCOI2008】斜堆
  6. Android 依赖注入可以更简单 —— 新版本 Dagger 2 使用教学
  7. 新基建数据中心如何建?附建设导则
  8. reactjs组件的生命周期函数:getDerivedStateFromProps
  9. python实现最长公共子序列的求解
  10. [css] 异步加载CSS的方式有哪些?
  11. 如何在 Intellij IDEA 更高效地将应用部署到容器服务 Kubernetes
  12. 《Java编码指南:编写安全可靠程序的75条建议》—— 指南19:对细粒度的安全定义自定义安全权限...
  13. 随机化算法 —— 数组置乱器的实现
  14. python整数缓存机制
  15. 拓端tecdat|约会数据动态可视化分析:R语言使用ggplot和ganimate制作的动画图
  16. GTK真不容易,资料少,学得人也少!
  17. 【Java】JSP完全自学手册
  18. 收益管理系统(PROS)缘何在中国水土不服?
  19. MySql解除安全模式
  20. SpringBoot - Lombok使用详解1(基本介绍、安装配置、var和val)

热门文章

  1. 人家也是干 IT 的。
  2. magento常用插件
  3. 数据分析报告的 8 种颜色
  4. 智慧城市建设中 网络安全攻防战如何打赢?
  5. java kryo 序列化_Kryo序列化
  6. nas存储用网线直连服务器,NAS将存储设备通过标准的网络拓扑结构连接,无需服务器直接上网...
  7. 公路路基路面回弹弯沉检测技术(转载)
  8. mysql最后一步装不上_mysql安装最后一步 安装不上
  9. 今日恐慌与贪婪指数为18 恐慌程度有所缓解
  10. 小成开发日记----物联网项目LoveTv实现web网页传输数据到单片机-表白女朋友(技术栈涉及web前端,php后端,c/c++ socket,嵌入式前后端)