数据集:
sileod/probability_words_nli
语言:
en计算机处理:
monolingual大小:
1K<n<10K语言创建人:
crowdsourced批注创建人:
expert-generated源数据集:
original许可:
apache-2.0此数据集测试了语言模型正确捕捉表示概率的词汇(WEP,也称为动词概率),例如诸如"probably"、"maybe"、"surely"、"impossible"等词汇的含义。
我们使用概率软逻辑结合使用WEP表达的概率性陈述(WEP-Reasoning),还使用UNLI数据集直接检查模型是否能够检测到与人工注释的概率匹配的WEP。
该数据集可用作自然语言推理数据(上下文、前提、标签)或多项选择题(上下文、有效假设、无效假设)。
代码: colab
已被Starsem2023(第12届词汇和计算语义联合会议)接受。暂时引用:
@article{sileo2022probing, title={Probing neural language models for understanding of words of estimative probability}, author={Sileo, Damien and Moens, Marie-Francine}, journal={arXiv preprint arXiv:2211.03358}, year={2022} }