数据集:
LanceaKing/asvspoof2019
任务:
音频分类语言:
en计算机处理:
monolingual大小:
100K<n<1M语言创建人:
other批注创建人:
other源数据集:
extended|vctk预印本库:
arxiv:1911.01601许可:
odc-by这是由Junichi Yamagishi、Massimiliano Todisco、Md Sahidullah、Héctor Delgado、Xin Wang、Nicholas Evans、Tomi Kinnunen、Kong Aik Lee、Ville Vestman和Andreas Nautsch于2019年组织的第三届自动说话者验证欺骗和对策挑战赛(ASVspoof 2019)使用的数据库。
[需要更多信息]
英语
{'speaker_id': 'LA_0091', 'audio_file_name': 'LA_T_8529430', 'audio': {'path': 'D:/Users/80304531/.cache/huggingface/datasets/downloads/extracted/8cabb6d5c283b0ed94b2219a8d459fea8e972ce098ef14d8e5a97b181f850502/LA/ASVspoof2019_LA_train/flac/LA_T_8529430.flac', 'array': array([-0.00201416, -0.00234985, -0.0022583 , ..., 0.01309204, 0.01339722, 0.01461792], dtype=float32), 'sampling_rate': 16000}, 'system_id': 'A01', 'key': 1}
逻辑访问(LA):
物理访问(PA):
speaker_id: PA_****,4位数的说话者ID
audio_file_name: 音频文件的名称
audio: 包含下载音频文件的路径、解码后的音频数组和采样率的字典。注意,在访问audio列时:dataset[0]["audio"],音频文件会自动解码并重新采样为dataset.features["audio"].sampling_rate。解码和重新采样大量音频文件可能需要很长时间。因此,在访问"audio"列之前,首选应首先查询示例索引,即dataset[0]["audio"]应始终优于dataset["audio"][0]。
environment_id: 一个三元组(S,R,D_s),取集合{a,b,c}中的一个字母作为分类值,定义为
a | b | c | |
---|---|---|---|
S: Room size (square meters) | 2-5 | 5-10 | 10-20 |
R: T60 (ms) | 50-200 | 200-600 | 600-1000 |
D_s: Talker-to-ASV distance (cm) | 10-50 | 50-100 | 100-150 |
attack_id: 一个二元组(D_a,Q),取集合{A,B,C}中的一个字母作为分类值,定义为
A | B | C | |
---|---|---|---|
Z: Attacker-to-talker distance (cm) | 10-50 | 50-100 | > 100 |
Q: Replay device quality | perfect | high | low |
对于真实语音,attack_id为空白(' - ')
key: 真实语音为'bonafide',欺骗语音为'spoof'
Training set | Development set | Evaluation set | |
---|---|---|---|
Bonafide | 2580 | 2548 | 7355 |
Spoof | 22800 | 22296 | 63882 |
Total | 25380 | 24844 | 71237 |
[需要更多信息]
[需要更多信息]
谁是源语言的生成者?[需要更多信息]
[需要更多信息]
谁是标注者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
This ASVspoof 2019 dataset is made available under the Open Data Commons Attribution License: http://opendatacommons.org/licenses/by/1.0/
@InProceedings{Todisco2019, Title = {{ASV}spoof 2019: {F}uture {H}orizons in {S}poofed and {F}ake {A}udio {D}etection}, Author = {Todisco, Massimiliano and Wang, Xin and Sahidullah, Md and Delgado, H ́ector and Nautsch, Andreas and Yamagishi, Junichi and Evans, Nicholas and Kinnunen, Tomi and Lee, Kong Aik}, booktitle = {Proc. of Interspeech 2019}, Year = {2019} }