数据集:

ehcalabres/ravdess_speech

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

no-annotation

源数据集:

original
英文

ravdess_speech数据集卡片

数据集概述

Ryerson 音频-视觉情感语音和歌曲数据库(RAVDESS)包含24名专业演员(12名女性,12名男性),用中性的北美口音发音两个在词汇上匹配的陈述。语音包括平静,快乐,悲伤,愤怒,害怕,惊讶和厌恶表达。每个表达以两个情绪强度级别(正常,强烈)产生,另外还有一个中性表达。音频文件的条件为:16位,48kHz的.wav文件。

支持的任务和排行榜

  • 音频分类: 此数据集可用于训练音频分类模型,该模型用于预测音频中的潜在情感。

语言

数据集中提供的音频为北美中性口音的英语演员发音。

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

来源数据

初始数据收集和标准化

[需要更多信息]

资源语言制作人是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

RAVDESS采用知识共享署名 - 非商业性使用 - 相同方式共享4.0国际许可协议 (CC BY-NC-SA 4.0) 发布。

RAVDESS也可以购买商业许可证。 有关更多信息,请访问我们的许可费用页面,或通过 ravdess@gmail.com 联系我们。

引用信息

Livingstone SR,Russo FA(2018)北美英语中的情感言语和歌曲的Ryerson音频-视觉数据库(RAVDESS):一组具有动态多模态的面部和声音表情。PLoS ONE 13(5):e0196391. https://doi.org/10.1371/journal.pone.0196391 .