数据集:
snips_built_in_intents
任务:
文本分类语言:
en计算机处理:
monolingual大小:
n<1K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
original预印本库:
arxiv:1805.10190许可:
cc0-1.0Snips内置意图的数据集最初用于比较不同的语音助手,并作为托管在 https://github.com/sonos/nlu-benchmark 文件夹中的公共数据集发布。该数据集包含10个意图类别的328个发言。相关的Medium文章是 https://medium.com/snips-ai/benchmarking-natural-language-understanding-systems-d35be6ce568d 。
没有相关的共享任务。
英语
该数据集包含10个意图类别的328个发言。每个样本的格式如下:{'label': 8, 'text': 'Transit directions to Barcelona Pizza.'}
源数据没有进行拆分。
该数据集最初是为了比较多个语音助手的性能而创建的。然而,标记的发言对于开发和基准测试文本聊天机器人也很有用。
不清楚数据是如何收集的。从Medium文章中得知:基准测试依赖于Snips业务团队创建的一组328个查询,并且在解决方案的开发过程中对数据科学家和工程师保密。
谁是源语言的制作者?最初由snips.ai准备。Snips团队于2019年11月加入Sonos。这些开放数据集仍然可用,现在由Sonos Voice Experience团队负责管理访问权限。如有任何问题,请发送电子邮件至sve-research@sonos.com。
不清楚数据是如何收集的。从Medium文章中得知:基准测试依赖于Snips业务团队创建的一组328个查询,并且在解决方案的开发过程中对数据科学家和工程师保密。
注释者是谁?[更多信息待添加]
[更多信息待添加]
[更多信息待添加]
[更多信息待添加]
[更多信息待添加]
最初由snips.ai准备。Snips团队于2019年11月加入Sonos。这些开放数据集仍然可用,现在由Sonos Voice Experience团队负责管理访问权限。如有任何问题,请发送电子邮件至sve-research@sonos.com。
源数据采用创作共用协议第1版通用零许可。
基于这些数据集的任何出版物必须包含对Snips团队于以下论文中发表的结果的完整引用:
Coucke A. et al.,“Snips Voice Platform:面向私有设计语音界面的嵌入式语音语言理解系统。” CoRR 2018, https://arxiv.org/abs/1805.10190
感谢 @bduvenhage 添加了该数据集。