VAM语料库--学习笔记

VAM语料库是从德国电视脱口秀节目“Vera am Mittag”（中午的Vera）的12小时录音中提取的。这些录音被分割成广播、对话表演和话语。视听演讲语料库包含从脱口秀嘉宾之间无脚本的真实讨论中录制的自发和情感演讲。从事自发语音分析、情感识别、语音和面部表情、自然语言理解和鲁棒语音识别的研究小组可能会对这些数据感兴趣。语言学家对数据中存在的各种德国区域口音的看法可能会产生进一步的兴趣。
情感标签：除了视听数据和分段话语之外，还为大部分数据提供情感标签。情绪标签以连续值的尺度给出三个情绪原语：价态（积极与消极），激活（平静与兴奋）和支配（弱与强）。几个人工评估人员分别进行了评估。作为一种方法，使用自我评估模型（见出版物）。
VAM视频：对赌视频语料库包含12个广播（节目）的视听信号。78 个话语（5 个扬声器）的其余子集共享为 352x288 像素、25 fps 的 mpg 文件。
VAM-音频:语料库的这一部分仅包含音频信号。VAM-Audio 语料库中总共包含 947 个语音。数据按 47 个独立说话人（11m/36f）进行组织。对于每个说话者，数据以句子的形式进行子结构。由于数据的来源，每个说话者的数据量不同：从4到46个话语。对于每个句子，提供一个 wav 文件。wav文件以16 kHz采样率和16位分辨率录制为立体声信号。情绪由几个独立的人类评估者评估：17名评估者分别用于脱口秀说话人1-19，6名评估者用于说话人20-47。提供每个评估员的评估（*.eva 文件）。此外，还提供了融合的情绪评估结果（*.ewe文件）。为了区分由大量评估员标记的第一组录音和第二组录音，建议将说话人1-19的话语称为“VAM-Audio I”，其余的称为“VAM-Audio II”。VAM 音频的文档集大小为 177 MB。
VAM-face:语料库的这一部分包含 VAM 视频语料库中说话人的提取面部图像。语料库包含从 VAM 视频语料库的视听语音记录中提取的 1867 张面部图像。数据是按 20 个说话人的子集按说话人组织的。对于每个句子，提供了几个面部图像作为png文件。图像的分辨率为 352x288 像素。情感内容使用情感原始标签价态，激活和支配（*.eva文件）进行标记。此外，还给出了情感类别标签（*.cat文件）。磁盘上的文档集大小为 255 MB。
更多信息可参考以下两篇论文：
1. https://www.sciencedirect.com/science/article/pii/S0167639307000040?via%3Dihub
2. The Vera am Mittag German audio-visual emotional speech database | IEEE Conference Publication | IEEE Xplore

VAM语料库--学习笔记相关推荐

(转载)机器学习知识点(二十九)LDA入门级学习笔记
入门级学习笔记 1.1文本建模相关统计文本建模的目的其实很简单:就是估算一组参数,这组参数使得整个语料库出现的概率最大.这是很简单的极大似然的思想了,就是认为观测到的样本的概率是最大的. 建模的目标 ...
SDCC 2016数据库峰会（深圳站）学习笔记
本文主要查阅了SDCC 2016数据库峰会(深圳站)PPT合集后的学习笔记,在此记录.下面的几个标题是各个PPT的文件标题. 01 金融大数据技术与实战-平安科技-王健宗背景 3月15日,持续七天的 ...
深度学习（四十二）word2vec词向量学习笔记
word2vec词向量学习笔记原文地址:http://blog.csdn.net/hjimce/article/details/51564783 个人微博:黄锦池-hjimce 一.使用原版word ...
python人工智能学习笔记_[Python] 人工智能与自然语言处理学习笔记（1）
最近我参加了一个人工智能与自然语言处理的课程,这是第一周的学习笔记.这份笔记不涉及一般知识,全部都是与实践(我在这门课上的作业)有关的总结. 文章目录理论学习人工智能的五种模型:作业1. Rule B ...
AI学习笔记（十五）自然语言处理基本概念
目录 AI学习笔记之自然语言处理自然语言处理(Natural Language Processing) 自然语言简介自然语言处理的难点自然语言处理的现状基于深度学习的自然语言处理 NLP的处理 ...
“领域知识图谱的构建与应用”讲座学习笔记
知识图谱是一种基于先进信息技术的型语义工具,它以实体或概念为节点,通过语义关系连接成大规模语义网络,可以帮助机器或信息系统理解语义.组织知识.发现知识,从而为人们提供知识.情报的智慧搜索和智能交互. ...
《Python自然语言处理（第二版）-Steven Bird等》学习笔记：第01章语言处理与Python
第01章语言处理与Python 1.1 语言计算:文本和单词 Python入门 NLTK 入门搜索文本计数词汇 1.2 近观Python:将文本当做词链表链表(list,也叫列表) 索引列表 ...
伯禹公益AI《动手学深度学习PyTorch版》Task 07 学习笔记
伯禹公益AI<动手学深度学习PyTorch版>Task 07 学习笔记 Task 07:优化算法进阶:word2vec:词嵌入进阶微信昵称:WarmIce 优化算法进阶 emmmm,讲实 ...
Task02：学习笔记文本预处理；语言模型；循环神经网络基础
Task02:学习笔记文本预处理:语言模型:循环神经网络基础文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本 ...
《智能对话机器人开发实战20讲》--学习笔记--AIML基础功能拓展-与互联网的集成
一.学习笔记环境要求: aiml bs4 语料库: tuling.aiml search_web.aiml <that>WHICH SEARCH ENGINE WOULD YOU LIK ...

VAM语料库--学习笔记

VAM语料库--学习笔记相关推荐

最新文章

热门文章