数据集:

LanceaKing/asvspoof2019

语言:

en

计算机处理:

monolingual

大小:

100K<n<1M

语言创建人:

other

批注创建人:

other

源数据集:

extended|vctk

预印本库:

arxiv:1911.01601

许可:

odc-by
英文

asvspoof2019 数据集卡片

数据集简介

这是由Junichi Yamagishi、Massimiliano Todisco、Md Sahidullah、Héctor Delgado、Xin Wang、Nicholas Evans、Tomi Kinnunen、Kong Aik Lee、Ville Vestman和Andreas Nautsch于2019年组织的第三届自动说话者验证欺骗和对策挑战赛(ASVspoof 2019)使用的数据库。

支持的任务和排行榜

[需要更多信息]

语言

英语

数据集结构

数据实例

{'speaker_id': 'LA_0091',
 'audio_file_name': 'LA_T_8529430',
 'audio': {'path': 'D:/Users/80304531/.cache/huggingface/datasets/downloads/extracted/8cabb6d5c283b0ed94b2219a8d459fea8e972ce098ef14d8e5a97b181f850502/LA/ASVspoof2019_LA_train/flac/LA_T_8529430.flac',
  'array': array([-0.00201416, -0.00234985, -0.0022583 , ...,  0.01309204,
          0.01339722,  0.01461792], dtype=float32),
  'sampling_rate': 16000},
 'system_id': 'A01',
 'key': 1}

数据字段

逻辑访问(LA):

  • speaker_id: LA_****,4位数的说话者ID
  • audio_file_name: 音频文件的名称
  • audio: 包含下载音频文件的路径、解码后的音频数组和采样率的字典。注意,在访问audio列时:dataset[0]["audio"],音频文件会自动解码并重新采样为dataset.features["audio"].sampling_rate。解码和重新采样大量音频文件可能需要很长时间。因此,在访问"audio"列之前,首选应首先查询示例索引,即dataset[0]["audio"]应始终优于dataset["audio"][0]。
  • system_id: 语音欺骗系统的ID(A01 - A19),对于真实语音,SYSTEM-ID为空白(' - ')
  • key: 真实语音为'bonafide',欺骗语音为'spoof'

物理访问(PA):

  • speaker_id: PA_****,4位数的说话者ID

  • audio_file_name: 音频文件的名称

  • audio: 包含下载音频文件的路径、解码后的音频数组和采样率的字典。注意,在访问audio列时:dataset[0]["audio"],音频文件会自动解码并重新采样为dataset.features["audio"].sampling_rate。解码和重新采样大量音频文件可能需要很长时间。因此,在访问"audio"列之前,首选应首先查询示例索引,即dataset[0]["audio"]应始终优于dataset["audio"][0]。

  • environment_id: 一个三元组(S,R,D_s),取集合{a,b,c}中的一个字母作为分类值,定义为

    a b c
    S: Room size (square meters) 2-5 5-10 10-20
    R: T60 (ms) 50-200 200-600 600-1000
    D_s: Talker-to-ASV distance (cm) 10-50 50-100 100-150
  • attack_id: 一个二元组(D_a,Q),取集合{A,B,C}中的一个字母作为分类值,定义为

    A B C
    Z: Attacker-to-talker distance (cm) 10-50 50-100 > 100
    Q: Replay device quality perfect high low

    对于真实语音,attack_id为空白(' - ')

  • key: 真实语音为'bonafide',欺骗语音为'spoof'

数据集拆分

Training set Development set Evaluation set
Bonafide 2580 2548 7355
Spoof 22800 22296 63882
Total 25380 24844 71237

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和标准化

[需要更多信息]

谁是源语言的生成者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

This ASVspoof 2019 dataset is made available under the Open Data Commons Attribution License: http://opendatacommons.org/licenses/by/1.0/

引用信息

@InProceedings{Todisco2019,
  Title     = {{ASV}spoof 2019: {F}uture {H}orizons in {S}poofed and {F}ake {A}udio {D}etection},
  Author    = {Todisco, Massimiliano and
               Wang, Xin and
               Sahidullah, Md and
               Delgado, H ́ector and
               Nautsch, Andreas and
               Yamagishi, Junichi and
               Evans, Nicholas and
               Kinnunen, Tomi and
               Lee, Kong Aik},
  booktitle = {Proc. of Interspeech 2019},
  Year      = {2019}
}