数据集:

ehcalabres/ravdess_speech

任务:

音频分类

语言:

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

no-annotation

源数据集:

original

许可:

cc-by-nc-sa-4.0

数据集介绍文件清单

英文

ravdess_speech数据集卡片

数据集概述

Ryerson 音频-视觉情感语音和歌曲数据库（RAVDESS）包含24名专业演员（12名女性，12名男性），用中性的北美口音发音两个在词汇上匹配的陈述。语音包括平静，快乐，悲伤，愤怒，害怕，惊讶和厌恶表达。每个表达以两个情绪强度级别（正常，强烈）产生，另外还有一个中性表达。音频文件的条件为：16位，48kHz的.wav文件。

支持的任务和排行榜

音频分类: 此数据集可用于训练音频分类模型，该模型用于预测音频中的潜在情感。

语言

数据集中提供的音频为北美中性口音的英语演员发音。

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

来源数据

初始数据收集和标准化

[需要更多信息]

资源语言制作人是谁？

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁？

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

RAVDESS采用知识共享署名 - 非商业性使用 - 相同方式共享4.0国际许可协议 (CC BY-NC-SA 4.0) 发布。

RAVDESS也可以购买商业许可证。有关更多信息，请访问我们的许可费用页面，或通过 ravdess@gmail.com 联系我们。

引用信息

Livingstone SR，Russo FA（2018）北美英语中的情感言语和歌曲的Ryerson音频-视觉数据库（RAVDESS）：一组具有动态多模态的面部和声音表情。PLoS ONE 13（5）：e0196391. https://doi.org/10.1371/journal.pone.0196391 .

作者:

ehcalabres

数据集大小:

4.93 KB