数据集:

LanceaKing/asvspoof2019

任务:

音频分类

语言:

计算机处理:

monolingual

大小:

100K<n<1M

语言创建人:

other

批注创建人:

other

源数据集:

extended|vctk

预印本库:

arxiv:1911.01601

其他:

voice-anti-spoofing

许可:

odc-by

数据集介绍文件清单

英文

asvspoof2019 数据集卡片

数据集简介

这是由Junichi Yamagishi、Massimiliano Todisco、Md Sahidullah、Héctor Delgado、Xin Wang、Nicholas Evans、Tomi Kinnunen、Kong Aik Lee、Ville Vestman和Andreas Nautsch于2019年组织的第三届自动说话者验证欺骗和对策挑战赛（ASVspoof 2019）使用的数据库。

支持的任务和排行榜

[需要更多信息]

语言

英语

数据集结构

数据实例

{'speaker_id': 'LA_0091',
 'audio_file_name': 'LA_T_8529430',
 'audio': {'path': 'D:/Users/80304531/.cache/huggingface/datasets/downloads/extracted/8cabb6d5c283b0ed94b2219a8d459fea8e972ce098ef14d8e5a97b181f850502/LA/ASVspoof2019_LA_train/flac/LA_T_8529430.flac',
  'array': array([-0.00201416, -0.00234985, -0.0022583 , ...,  0.01309204,
          0.01339722,  0.01461792], dtype=float32),
  'sampling_rate': 16000},
 'system_id': 'A01',
 'key': 1}

数据字段

逻辑访问（LA）：

speaker_id: LA_****，4位数的说话者ID
audio_file_name: 音频文件的名称
audio: 包含下载音频文件的路径、解码后的音频数组和采样率的字典。注意，在访问audio列时：dataset[0]["audio"]，音频文件会自动解码并重新采样为dataset.features["audio"].sampling_rate。解码和重新采样大量音频文件可能需要很长时间。因此，在访问"audio"列之前，首选应首先查询示例索引，即dataset[0]["audio"]应始终优于dataset["audio"][0]。
system_id: 语音欺骗系统的ID（A01 - A19），对于真实语音，SYSTEM-ID为空白（' - '）
key: 真实语音为'bonafide'，欺骗语音为'spoof'

物理访问（PA）：

speaker_id: PA_****，4位数的说话者ID
audio_file_name: 音频文件的名称
audio: 包含下载音频文件的路径、解码后的音频数组和采样率的字典。注意，在访问audio列时：dataset[0]["audio"]，音频文件会自动解码并重新采样为dataset.features["audio"].sampling_rate。解码和重新采样大量音频文件可能需要很长时间。因此，在访问"audio"列之前，首选应首先查询示例索引，即dataset[0]["audio"]应始终优于dataset["audio"][0]。

environment_id: 一个三元组（S,R,D_s），取集合{a,b,c}中的一个字母作为分类值，定义为

a	b	c
S: Room size (square meters)	2-5	5-10	10-20
R: T60 (ms)	50-200	200-600	600-1000
D_s: Talker-to-ASV distance (cm)	10-50	50-100	100-150

attack_id: 一个二元组（D_a,Q），取集合{A,B,C}中的一个字母作为分类值，定义为

A	B	C
Z: Attacker-to-talker distance (cm)	10-50	50-100	> 100
Q: Replay device quality	perfect	high	low

对于真实语音，attack_id为空白（' - '）

key: 真实语音为'bonafide'，欺骗语音为'spoof'

数据集拆分

Training set	Development set	Evaluation set
Bonafide	2580	2548	7355
Spoof	22800	22296	63882
Total	25380	24844	71237

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

谁是源语言的生成者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

This ASVspoof 2019 dataset is made available under the Open Data Commons Attribution License: http://opendatacommons.org/licenses/by/1.0/

引用信息

@InProceedings{Todisco2019,
  Title     = {{ASV}spoof 2019: {F}uture {H}orizons in {S}poofed and {F}ake {A}udio {D}etection},
  Author    = {Todisco, Massimiliano and
               Wang, Xin and
               Sahidullah, Md and
               Delgado, H ́ector and
               Nautsch, Andreas and
               Yamagishi, Junichi and
               Evans, Nicholas and
               Kinnunen, Tomi and
               Lee, Kong Aik},
  booktitle = {Proc. of Interspeech 2019},
  Year      = {2019}
}

作者:

LanceaKing

数据集大小:

7.42 MB