数据集:

tner/mit_restaurant

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

许可:

other
英文

"tner/mit_restaurant" 数据集卡片

数据集概述

MIT餐厅NER数据集格式化为 TNER 项目的一部分。

  • 实体类型:评级,便利设施,位置,餐厅名称,价格,营业时间,菜品,菜系。

数据集结构

数据实例

"train" 的一个示例如下所示。

{
    'tags': [0, 0, 0, 0, 0, 0, 0, 0, 5, 3, 4, 0],
    'tokens': ['can', 'you', 'find', 'the', 'phone', 'number', 'for', 'the', 'closest', 'family', 'style', 'restaurant']
}

标签ID

label2id 字典可以在 here 中找到。

{
    "O": 0,
    "B-Rating": 1,
    "I-Rating": 2,
    "B-Amenity": 3,
    "I-Amenity": 4,
    "B-Location": 5,
    "I-Location": 6,
    "B-Restaurant_Name": 7,
    "I-Restaurant_Name": 8,
    "B-Price": 9,
    "B-Hours": 10,
    "I-Hours": 11,
    "B-Dish": 12,
    "I-Dish": 13,
    "B-Cuisine": 14,
    "I-Price": 15,
    "I-Cuisine": 16
}

数据拆分

name train validation test
mit_restaurant 6900 760 1521