数据集:

GEM/RiSAWOZ

许可:

cc-by-4.0

任务:

对话

语言:

zh

计算机处理:

unknown

语言创建人:

unknown

批注创建人:

crowd-sourced

源数据集:

original
英文

GEM/RiSAWOZ 数据集卡片

主数据卡片链接

您可以在 GEM Website 上找到主数据卡片。

数据集概述

RiSAWOZ 是一个中文对话数据集。可以用于研究各种对话任务,例如对话状态跟踪,对话上下文到文本生成,共指消解和统一生成省略与共指消解。

您可以通过以下方式加载数据集:

import datasets
data = datasets.load_dataset('GEM/RiSAWOZ')

数据加载器可以在 here 找到。

网站

Website

论文

ACL Anthology

作者

Jun Quan (苏州大学, 中国苏州), Shian Zhang (苏州大学, 中国苏州), Qian Cao (苏州大学, 中国苏州), Zizhong Li (天津大学, 中国天津), Deyi Xiong (天津大学, 中国天津)

数据集概览

数据和文档的获取位置

网页

Website

下载

Github

论文

ACL Anthology

BibTex
@inproceedings{quan-etal-2020-risawoz,
    title = "{R}i{SAWOZ}: A Large-Scale Multi-Domain {W}izard-of-{O}z Dataset with Rich Semantic Annotations for Task-Oriented Dialogue Modeling",
    author = "Quan, Jun  and
      Zhang, Shian  and
      Cao, Qian  and
      Li, Zizhong  and
      Xiong, Deyi",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.emnlp-main.67",
    pages = "930--940",
}
联系人姓名

Deyi Xiong

联系人邮箱

dyxiong@tju.edu.cn

有排行榜吗?

语言和使用目的

支持多语言?

涵盖方言

此数据集仅涵盖普通话。

涵盖的语言

普通话

许可证

cc-by-4.0:知识共享署名4.0国际许可证

使用目的

RiSAWOZ可用于支持各种对话任务的研究,例如自然语言理解,对话状态跟踪,对话上下文到文本生成,共指消解和统一生成省略与共指消解。

主要任务

对话回复生成

交流目标

在给定对话上下文的情况下生成系统回复,涵盖多个领域。

信用

策划组织类型

学术

策划组织

苏州大学和天津大学

数据集创建者

Jun Quan (苏州大学, 中国苏州), Shian Zhang (苏州大学, 中国苏州), Qian Cao (苏州大学, 中国苏州), Zizhong Li (天津大学, 中国天津), Deyi Xiong (天津大学, 中国天津)

资金支持

国家重点研发计划

谁将数据集添加到GEM中?

Tianhao Shen (天津大学, 中国天津), Chaobin You (天津大学, 中国天津), Deyi Xiong (天津大学, 中国天津)

数据集结构

数据字段
  • gem_id(字符串):GEM-RiSAWOZ-{split}-{id}
  • dialogue_id(字符串):对话ID
  • goal(字符串):用户目标的自然语言描述
  • domains(字符串列表):当前对话会话中提到的领域
  • dialogue(字典列表):对话轮和相应的注释。每个轮包括:
    • turn_id(整数):轮ID
    • turn_domain(字符串列表):当前轮次中提到的领域
    • user_utterance(字符串):用户话语
    • system_utterance(字符串):系统话语
    • belief_state(字典):对话状态,包括:
      • inform slot-values(字典):至当前轮通知的插槽和相应的值
      • turn_inform(字典):当前轮通知的插槽和相应的值
      • turn request(字典):当前轮请求的插槽
    • user_actions(列表列表):当前轮中用户的对话行为
    • system_actions(列表列表):当前轮中系统的对话行为
    • db_results(字符串列表):数据库搜索结果
    • segmented_user_utterance(字符串):用户话语的词语分割结果
    • segmented_system_utterance(字符串):系统话语的词语分割结果
示例实例
[
    {
        "dialogue_id": "attraction_goal_4-63###6177",
        "goal": "attraction_goal_4-63: 你是苏州人,但不怎么出去玩。你朋友来苏州找你,你准备带他逛逛“水乡古镇”,你希望客服给你推荐个消费水平“中等”的地方。然后你要问清楚这地方“是否地铁直达”、“特点”、“门票价格”这些信息。最后,你要感谢客服的帮助,然后说再见。",
        "domains": [
            "旅游景点"
        ],
        "dialogue": [
            {
                "turn_id": 0,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "你好,我是苏州人,但是不怎么出去玩,我朋友来苏州找我了,我准备带他逛逛水乡古镇,你能帮我推荐一下吗?",
                "system_utterance": "推荐您去周庄古镇。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-景点类型": "水乡 古镇"
                    },
                    "turn_inform": {
                        "旅游景点-景点类型": "水乡 古镇"
                    },
                    "turn request": []
                },
                "user_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "景点类型",
                        "水乡 古镇"
                    ],
                    [
                        "Greeting",
                        "旅游景点",
                        "",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Recommend",
                        "旅游景点",
                        "名称",
                        "周庄 古镇"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为8",
                    "{'名称': '周庄古镇', '区域': '昆山', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '偏贵', '是否地铁直达': '否', '门票价格': '100元', '电话号码': '400-8282900', '地址': '苏州市昆山市周庄镇全福路43号', '评分': 4.5, '开放时间': '07:30-18:50', '特点': '小桥流水与人家,双桥水巷摇橹船,还有沈万三的足迹待你寻访'}",
                    "{'名称': '同里古镇', '区域': '吴江', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '偏贵', '是否地铁直达': '否', '门票价格': '100元', '电话号码': '0512-63325728', '地址': '苏州市吴江区同里古镇', '评分': 4.5, '开放时间': '07:30-17:30', '特点': '五湖环抱的江南水乡古镇,走三桥,参观小巧精致的园林退思园。'}",
                    "{'名称': '山塘街', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-65314467', '地址': '苏州市姑苏区古城西北', '评分': 4.5, '开放时间': '08:30-21:00', '特点': '欣赏苏州老城风貌,参观会馆等古迹,乘游船,拍摄美丽的夜景。'}",
                    "{'名称': '平江路', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-69163907', '地址': '江苏省苏州市姑苏区白塔东路65号', '评分': 4.5, '开放时间': '全天', '特点': '漫步保存完整的古街区,看小桥流水古宅,逛文艺小店,吃美食。'}",
                    "{'名称': '木渎古镇', '区域': '吴中区', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '便宜', '是否地铁直达': '否', '门票价格': '免费', '电话号码': '0512-66514042', '地址': '苏州市吴中区木渎镇山塘街188号', '评分': 4.4, '开放时间': '08:30-17:00', '特点': '以园林为特色的古镇,游严家花园等古典园林,坐船看小桥流水。'}",
                    "{'名称': '甪直古镇', '区域': '吴中区', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '便宜', '是否地铁直达': '否', '门票价格': '免费', '电话号码': '0512-66191668', '地址': '苏州市吴中区甪直镇晓市路21号', '评分': 4.3, '开放时间': '07:30-17:30', '特点': '甪直古镇有2500多年历史,甪直境内水流纵横,桥梁密布,有五湖之厅、六泽之冲之称。'}",
                    "{'名称': '千灯古镇', '区域': '昆山', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '便宜', '是否地铁直达': '否', '门票价格': '免费', '电话号码': '0512-57472155', '地址': '苏州市昆山市千灯古镇尚书路1号', '评分': 4.3, '开放时间': '08:00-17:00', '特点': '千灯古镇,距今已有2500多年的历史,古镇白墙黑瓦,昆韵盎然。'}",
                    "{'名称': '锦溪古镇', '区域': '昆山', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '中等', '是否地铁直达': '否', '门票价格': '65元', '电话号码': '0512-57224669', '地址': '苏州市昆山市锦溪镇邵甸港路18号', '评分': 4.4, '开放时间': '08:00-17:00', '特点': '锦溪古镇位于昆山南郊的淀山湖畔,是一座有千年历史的江南水乡。'}"
                ],
                "segmented_user_utterance": "你好 , 我 是 苏州人 , 但是 不怎么 出去玩 , 我 朋友 来 苏州 找 我 了 , 我 准备 带 他 逛逛 水乡 古镇 , 你 能 帮 我 推荐 一下 吗 ?",
                "segmented_system_utterance": "推荐 您 去 周庄 古镇 。"
            },
            {
                "turn_id": 1,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "我希望这个地方消费水平适中的,这个是中等的吗?",
                "system_utterance": "这个不是,我又重新帮您找了一家山塘街。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-景点类型": "水乡 古镇",
                        "旅游景点-消费": "中等"
                    },
                    "turn_inform": {
                        "旅游景点-消费": "中等"
                    },
                    "turn request": []
                },
                "user_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "消费",
                        "中等"
                    ]
                ],
                "system_actions": [
                    [
                        "Recommend",
                        "旅游景点",
                        "名称",
                        "山塘 街"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为3",
                    "{'名称': '山塘街', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-65314467', '地址': '苏州市姑苏区古城西北', '评分': 4.5, '开放时间': '08:30-21:00', '特点': '欣赏苏州老城风貌,参观会馆等古迹,乘游船,拍摄美丽的夜景。'}",
                    "{'名称': '平江路', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-69163907', '地址': '江苏省苏州市姑苏区白塔东路65号', '评分': 4.5, '开放时间': '全天', '特点': '漫步保存完整的古街区,看小桥流水古宅,逛文艺小店,吃美食。'}",
                    "{'名称': '锦溪古镇', '区域': '昆山', '景点类型': '水乡古镇', '最适合人群': '朋友出游', '消费': '中等', '是否地铁直达': '否', '门票价格': '65元', '电话号码': '0512-57224669', '地址': '苏州市昆山市锦溪镇邵甸港路18号', '评分': 4.4, '开放时间': '08:00-17:00', '特点': '锦溪古镇位于昆山南郊的淀山湖畔,是一座有千年历史的江南水乡。'}"
                ],
                "segmented_user_utterance": "我 希望 这个 地方 消费水平 适中 的 , 这个 是 中等 的 吗 ?",
                "segmented_system_utterance": "这个 不是 , 我 又 重新 帮 您 找 了 一家 山塘 街 。"
            },
            {
                "turn_id": 2,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "听这地方应该挺好玩,他们家特点是什么?",
                "system_utterance": "特点是欣赏苏州老城风貌,参观会馆等古迹,乘游船,拍摄美丽的夜景。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-景点类型": "水乡 古镇",
                        "旅游景点-消费": "中等",
                        "旅游景点-名称": "山塘 街"
                    },
                    "turn_inform": {
                        "旅游景点-名称": "山塘 街"
                    },
                    "turn request": [
                        "特点"
                    ]
                },
                "user_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "名称",
                        "山塘 街"
                    ],
                    [
                        "Request",
                        "旅游景点",
                        "特点",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "特点",
                        "欣赏 苏州 老城 风貌 , 参观 会馆 等 古迹 , 乘 游船 , 拍摄 美丽 的 夜景"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为1",
                    "{'名称': '山塘街', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-65314467', '地址': '苏州市姑苏区古城西北', '评分': 4.5, '开放时间': '08:30-21:00', '特点': '欣赏苏州老城风貌,参观会馆等古迹,乘游船,拍摄美丽的夜景。'}"
                ],
                "segmented_user_utterance": "听 这 地方 应该 挺好玩 , 他们 家 特点 是 什么 ?",
                "segmented_system_utterance": "特点 是 欣赏 苏州 老城 风貌 , 参观 会馆 等 古迹 , 乘 游船 , 拍摄 美丽 的 夜景 。"
            },
            {
                "turn_id": 3,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "听起来很不错,他们家门票是多少?",
                "system_utterance": "门票免费。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-景点类型": "水乡 古镇",
                        "旅游景点-消费": "中等",
                        "旅游景点-名称": "山塘 街"
                    },
                    "turn_inform": {},
                    "turn request": [
                        "门票价格"
                    ]
                },
                "user_actions": [
                    [
                        "Request",
                        "旅游景点",
                        "门票价格",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "门票价格",
                        "免费"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为1",
                    "{'名称': '山塘街', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-65314467', '地址': '苏州市姑苏区古城西北', '评分': 4.5, '开放时间': '08:30-21:00', '特点': '欣赏苏州老城风貌,参观会馆等古迹,乘游船,拍摄美丽的夜景。'}"
                ],
                "segmented_user_utterance": "听 起来 很 不错 , 他们 家 门票 是 多少 ?",
                "segmented_system_utterance": "门票 免费 。"
            },
            {
                "turn_id": 4,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "还行,那他们家是否有地铁直达呢?",
                "system_utterance": "嗯嗯,可以地铁直达。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-景点类型": "水乡 古镇",
                        "旅游景点-消费": "中等",
                        "旅游景点-名称": "山塘 街"
                    },
                    "turn_inform": {},
                    "turn request": [
                        "是否地铁直达"
                    ]
                },
                "user_actions": [
                    [
                        "Request",
                        "旅游景点",
                        "是否地铁直达",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "是否地铁直达",
                        "是"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为1",
                    "{'名称': '山塘街', '区域': '姑苏区', '景点类型': '水乡古镇', '最适合人群': '情侣约会', '消费': '中等', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '0512-65314467', '地址': '苏州市姑苏区古城西北', '评分': 4.5, '开放时间': '08:30-21:00', '特点': '欣赏苏州老城风貌,参观会馆等古迹,乘游船,拍摄美丽的夜景。'}"
                ],
                "segmented_user_utterance": "还 行 , 那 他们 家 是否 有 地铁 直达 呢 ?",
                "segmented_system_utterance": "嗯 嗯 , 可以 地铁 直达 。"
            },
            {
                "turn_id": 5,
                "turn_domain": [
                    "通用"
                ],
                "user_utterance": "谢谢你的帮助,再见!",
                "system_utterance": "再见。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-景点类型": "水乡 古镇",
                        "旅游景点-消费": "中等",
                        "旅游景点-名称": "山塘 街"
                    },
                    "turn_inform": {},
                    "turn request": []
                },
                "user_actions": [
                    [
                        "Bye",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Bye",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "db_results": [],
                "segmented_user_utterance": "谢谢 你 的 帮助 , 再见 !",
                "segmented_system_utterance": "再见 。"
            }
        ]
    },
    {
        "dialogue_id": "attraction_goal_3-33_v2###7307",
        "goal": "attraction_goal_3-33: 你和朋友一起来苏州出差,顺便想去“苏州乐园森林水世界”逛一逛。因此,你要询问客服这个地方“是否地铁直达”、“评分”、“特点”这些信息。最后,你向客服表示感谢,结束对话。",
        "domains": [
            "旅游景点"
        ],
        "dialogue": [
            {
                "turn_id": 0,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "你好,我和朋友一起来苏州出差,顺便想去苏州乐园森林水世界玩玩,能否帮我看看这个地方是否有地铁直达呢?",
                "system_utterance": "稍等,很抱歉,没有地铁能直接到这个景点呢。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn_inform": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn request": [
                        "是否地铁直达"
                    ]
                },
                "user_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "名称",
                        "苏州 乐园 森林 水 世界"
                    ],
                    [
                        "Request",
                        "旅游景点",
                        "是否地铁直达",
                        ""
                    ],
                    [
                        "Greeting",
                        "旅游景点",
                        "",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "是否地铁直达",
                        "否"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为1",
                    "{'名称': '苏州乐园森林水世界', '区域': '高新区', '景点类型': '游乐场', '最适合人群': '情侣约会', '消费': '偏贵', '是否地铁直达': '否', '门票价格': '198元', '电话号码': '0512-68717107', '地址': '苏州市高新区阳山东路以西,山神湾路以东', '评分': 4.4, '开放时间': '09:00-17:00', '特点': '各项水上娱乐项目皆具森林特色,被赋予森林主题,让人身处浩瀚森林又能享受到海洋般的舒爽水游乐。'}"
                ],
                "segmented_user_utterance": "你好 , 我 和 朋友 一 起来 苏州 出差 , 顺便 想 去 苏州 乐园 森林 水 世界 玩玩 , 能否 帮 我 看看 这个 地方 是否 有 地铁 直达 呢 ?",
                "segmented_system_utterance": "稍 等 , 很 抱歉 , 没有 地铁 能 直接 到 这个 景点 呢 。"
            },
            {
                "turn_id": 1,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "你再帮我看看景点的评分好吗?",
                "system_utterance": "这个景点的评分是4.4分。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn_inform": {},
                    "turn request": [
                        "评分"
                    ]
                },
                "user_actions": [
                    [
                        "Request",
                        "旅游景点",
                        "评分",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "评分",
                        "4.4"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为1",
                    "{'名称': '苏州乐园森林水世界', '区域': '高新区', '景点类型': '游乐场', '最适合人群': '情侣约会', '消费': '偏贵', '是否地铁直达': '否', '门票价格': '198元', '电话号码': '0512-68717107', '地址': '苏州市高新区阳山东路以西,山神湾路以东', '评分': 4.4, '开放时间': '09:00-17:00', '特点': '各项水上娱乐项目皆具森林特色,被赋予森林主题,让人身处浩瀚森林又能享受到海洋般的舒爽水游乐。'}"
                ],
                "segmented_user_utterance": "你 再 帮 我 看看 景点 的 评分 好 吗 ?",
                "segmented_system_utterance": "这个 景点 的 评分 是 4.4 分 。"
            },
            {
                "turn_id": 2,
                "turn_domain": [
                    "旅游景点"
                ],
                "user_utterance": "这个景点有啥特点呢?",
                "system_utterance": "这个景点的特点是各项水上娱乐项目皆具森林特色,被赋予森林主题,让人身处浩瀚森林又能享受到海洋般的舒爽水游乐。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn_inform": {},
                    "turn request": [
                        "特点"
                    ]
                },
                "user_actions": [
                    [
                        "Request",
                        "旅游景点",
                        "特点",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Inform",
                        "旅游景点",
                        "特点",
                        "各项 水上 娱乐 项目 皆 具 森林 特色 , 被 赋予 森林 主题 , 让 人 身处 浩瀚 森林 又 能 享受 到 海洋 般的 舒爽 水 游乐 。"
                    ]
                ],
                "db_results": [
                    "数据库检索结果:成功匹配个数为1",
                    "{'名称': '苏州乐园森林水世界', '区域': '高新区', '景点类型': '游乐场', '最适合人群': '情侣约会', '消费': '偏贵', '是否地铁直达': '否', '门票价格': '198元', '电话号码': '0512-68717107', '地址': '苏州市高新区阳山东路以西,山神湾路以东', '评分': 4.4, '开放时间': '09:00-17:00', '特点': '各项水上娱乐项目皆具森林特色,被赋予森林主题,让人身处浩瀚森林又能享受到海洋般的舒爽水游乐。'}"
                ],
                "segmented_user_utterance": "这个 景点 有 啥 特点 呢 ?",
                "segmented_system_utterance": "这个 景点 的 特点 是 各项 水上 娱乐 项目 皆 具 森林 特色 , 被 赋予 森林 主题 , 让 人 身处 浩瀚 森林 又 能 享受 到 海洋 般的 舒爽 水 游乐 。"
            },
            {
                "turn_id": 3,
                "turn_domain": [
                    "通用"
                ],
                "user_utterance": "太好了,我觉得我会很喜欢这个地方,哈哈。",
                "system_utterance": "这个景点挺不错的,就是没有地铁需要您乘坐其它交通工具了。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn_inform": {},
                    "turn request": []
                },
                "user_actions": [
                    [
                        "General",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "General",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "db_results": [],
                "segmented_user_utterance": "太好了 , 我 觉得 我会 很 喜欢 这个 地方 , 哈哈 。",
                "segmented_system_utterance": "这个 景点 挺不错 的 , 就是 没有 地铁 需要 您 乘坐 其它 交通工具 了 。"
            },
            {
                "turn_id": 4,
                "turn_domain": [
                    "通用"
                ],
                "user_utterance": "我打出租车去吧,就是多花点车费,没事。",
                "system_utterance": "请问您还有其他问题吗?",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn_inform": {},
                    "turn request": []
                },
                "user_actions": [
                    [
                        "General",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "General",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "db_results": [],
                "segmented_user_utterance": "我 打 出租车 去 吧 , 就是 多花点 车费 , 没事 。",
                "segmented_system_utterance": "请问 您 还有 其他 问题 吗 ?"
            },
            {
                "turn_id": 5,
                "turn_domain": [
                    "通用"
                ],
                "user_utterance": "没有了。谢谢你,再见。",
                "system_utterance": "再见。",
                "belief_state": {
                    "inform slot-values": {
                        "旅游景点-名称": "苏州 乐园 森林 水 世界"
                    },
                    "turn_inform": {},
                    "turn request": []
                },
                "user_actions": [
                    [
                        "Bye",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "system_actions": [
                    [
                        "Bye",
                        "通用",
                        "",
                        ""
                    ]
                ],
                "db_results": [],
                "segmented_user_utterance": "没有 了 。 谢谢 你 , 再见 。",
                "segmented_system_utterance": "再见 。"
            }
        ]
    }
]
数据拆分
  • 训练集:
    • 对话:10000
    • 轮数:134580
    • 平均轮数:13.5
  • 验证集:
    • 对话:600
    • 轮数:8116
    • 平均轮数:13.5
  • 测试集:
    • 对话:600
    • 轮数:9286
    • 平均轮数:15.5

最复杂的示例(即包含最多的领域):

{
    "dialogue_id": "attraction_restaurant_hotel_goal_2-69_v2###8355",
    "goal": "attraction_restaurant_hotel_goal_2-69: 公司派你去苏州出差,你准备抽空旅游一下。第一,你想去一个“山水景区”,消费水平最好是“偏贵”的,你需要问清楚这地方“开放时间”、“门票价格”这些信息。第二,你要找个地方住,让客服给你推荐一家价位“中等”的“商务出行”酒店,并且询问这家酒店的“停车场”、“电话号码”这些信息。第三,你还想拔草美食,问客服有没有价位“中等”的“江浙菜”餐厅推荐,然后了解这家餐厅的“是否地铁直达”、“人均消费”这些信息。最后你要感谢客服的帮助,并说再见。",
    "domains": [
        "旅游景点",
        "餐厅",
        "酒店"
    ],
    "dialogue": [
        {
            "turn_id": 0,
            "turn_domain": [
                "旅游景点"
            ],
            "user_utterance": "你好,来苏州出差,准备抽空旅游一下。我想去山水景区,消费水平偏贵点,帮忙推荐一个。",
            "system_utterance": "你好,向您推荐金鸡湖景区,感受一下苏州现代化的一面。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵"
                },
                "turn_inform": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵"
                },
                "turn request": []
            },
            "user_actions": [
                [
                    "Inform",
                    "旅游景点",
                    "景点类型",
                    "山水 景区"
                ],
                [
                    "Inform",
                    "旅游景点",
                    "消费",
                    "偏贵"
                ],
                [
                    "Greeting",
                    "旅游景点",
                    "",
                    ""
                ],
                [
                    "General",
                    "旅游景点",
                    "",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Greeting",
                    "通用",
                    "",
                    ""
                ],
                [
                    "General",
                    "通用",
                    "",
                    ""
                ],
                [
                    "Recommend",
                    "旅游景点",
                    "名称",
                    "金鸡湖 景区"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为2",
                "{'名称': '金鸡湖景区', '区域': '工业园区', '景点类型': '山水景区', '最适合人群': '情侣约会', '消费': '偏贵', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '400-7558558', '地址': '苏州市工业园区星港街158号', '评分': 4.5, '开放时间': '全天', '特点': '看东方之门等高楼,坐摩天轮,乘船夜游,感受苏州现代化的一面。'}",
                "{'名称': '沙家浜风景区', '区域': '常熟', '景点类型': '山水景区', '最适合人群': '家庭亲子', '消费': '偏贵', '是否地铁直达': '否', '门票价格': '110元', '电话号码': '0512-52500000', '地址': '苏州市常熟市沙家浜镇', '评分': 4.5, '开放时间': '08:00-16:30', '特点': '京剧样板戏《沙家浜》的发源地,访剧中场景,坐船深入芦苇荡。'}"
            ],
            "segmented_user_utterance": "你好 , 来 苏州 出差 , 准备 抽空 旅游 一下 。 我 想 去 山水 景区 , 消费水平 偏 贵点 , 帮忙 推荐 一个 。",
            "segmented_system_utterance": "你好 , 向 您 推荐 金鸡湖 景区 , 感受一下 苏州 现代化 的 一面 。"
        },
        {
            "turn_id": 1,
            "turn_domain": [
                "旅游景点"
            ],
            "user_utterance": "这里开放时间?需要安排一下。",
            "system_utterance": "景区是全天开放的,可以尽情游览!",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区"
                },
                "turn_inform": {
                    "旅游景点-名称": "金鸡湖 景区"
                },
                "turn request": [
                    "开放时间"
                ]
            },
            "user_actions": [
                [
                    "Inform",
                    "旅游景点",
                    "名称",
                    "金鸡湖 景区"
                ],
                [
                    "Request",
                    "旅游景点",
                    "开放时间",
                    ""
                ],
                [
                    "General",
                    "旅游景点",
                    "",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Inform",
                    "旅游景点",
                    "开放时间",
                    "全天"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为1",
                "{'名称': '金鸡湖景区', '区域': '工业园区', '景点类型': '山水景区', '最适合人群': '情侣约会', '消费': '偏贵', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '400-7558558', '地址': '苏州市工业园区星港街158号', '评分': 4.5, '开放时间': '全天', '特点': '看东方之门等高楼,坐摩天轮,乘船夜游,感受苏州现代化的一面。'}"
            ],
            "segmented_user_utterance": "这里 开放 时间 ? 需要 安排 一下 。",
            "segmented_system_utterance": "景区 是 全天 开放 的 , 可以 尽情 游览 !"
        },
        {
            "turn_id": 2,
            "turn_domain": [
                "旅游景点"
            ],
            "user_utterance": "门票多少钱?",
            "system_utterance": "这里是免费景区。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区"
                },
                "turn_inform": {},
                "turn request": [
                    "门票价格"
                ]
            },
            "user_actions": [
                [
                    "Request",
                    "旅游景点",
                    "门票价格",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Inform",
                    "旅游景点",
                    "门票价格",
                    "免费"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为1",
                "{'名称': '金鸡湖景区', '区域': '工业园区', '景点类型': '山水景区', '最适合人群': '情侣约会', '消费': '偏贵', '是否地铁直达': '是', '门票价格': '免费', '电话号码': '400-7558558', '地址': '苏州市工业园区星港街158号', '评分': 4.5, '开放时间': '全天', '特点': '看东方之门等高楼,坐摩天轮,乘船夜游,感受苏州现代化的一面。'}"
            ],
            "segmented_user_utterance": "门票 多少 钱 ?",
            "segmented_system_utterance": "这里 是 免费 景区 。"
        },
        {
            "turn_id": 3,
            "turn_domain": [
                "酒店"
            ],
            "user_utterance": "哦,好的。还有酒店,帮我推荐个价位中等的商务酒店!",
            "system_utterance": "推荐苏州金鸡湖李公堤瑞贝庭公寓酒店,在金鸡湖景区附近。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行"
                },
                "turn_inform": {
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行"
                },
                "turn request": []
            },
            "user_actions": [
                [
                    "Inform",
                    "酒店",
                    "价位",
                    "中等"
                ],
                [
                    "Inform",
                    "酒店",
                    "酒店类型",
                    "商务 出行"
                ],
                [
                    "General",
                    "酒店",
                    "",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Recommend",
                    "酒店",
                    "名称",
                    "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                ],
                [
                    "General",
                    "通用",
                    "",
                    ""
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为16",
                "{'名称': '苏州慢享主题酒店', '区域': '姑苏区', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '收费', '房费': '266元', '地址': '苏州姑苏区景德路26-64号', '电话号码': '0512-67570999', '评分': 4.7}",
                "{'名称': '苏州慢享主题酒店', '区域': '姑苏区', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '收费', '房费': '278元', '地址': '苏州姑苏区景德路26-64号', '电话号码': '0512-67570999', '评分': 4.7}",
                "{'名称': '美锦酒店', '区域': '高新区', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '308元', '地址': '苏州高新区滨河路999号花样年喜年生活广场5栋1层', '电话号码': '0512-66053331', '评分': 4.8}",
                "{'名称': '美锦酒店', '区域': '高新区', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '349元', '地址': '苏州高新区滨河路999号花样年喜年生活广场5栋1层', '电话号码': '0512-66053331', '评分': 4.8}",
                "{'名称': '苏州金鸡湖李公堤瑞贝庭公寓酒店', '区域': '工业园区', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '438元', '地址': '苏州工业园区李公堤三期E区商业街9幢', '电话号码': '0512-69995666', '评分': 4.6}",
                "{'名称': '苏州金鸡湖李公堤瑞贝庭公寓酒店', '区域': '工业园区', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '438元', '地址': '苏州工业园区李公堤三期E区商业街9幢', '电话号码': '0512-69995666', '评分': 4.6}",
                "{'名称': '苏州途乐酒店公寓', '区域': '工业园区', '星级': '2', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '收费', '房费': '486元', '地址': '苏州工业园区苏州丰隆城市中心T1楼', '电话号码': '151-5149-7911', '评分': 4.6}",
                "{'名称': '苏州途乐酒店公寓', '区域': '工业园区', '星级': '2', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '收费', '房费': '486元', '地址': '苏州工业园区苏州丰隆城市中心T1楼', '电话号码': '151-5149-7911', '评分': 4.6}",
                "{'名称': '万悦酒店', '区域': '吴中区', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '346元', '地址': '苏州吴中区金山路47-2号', '电话号码': '0512-83808380', '评分': 4.5}",
                "{'名称': '万悦酒店', '区域': '吴中区', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '338元', '地址': '苏州吴中区金山路47-2号', '电话号码': '0512-83808380', '评分': 4.5}",
                "{'名称': '周庄多瓦台临河客栈', '区域': '昆山', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '收费', '房费': '279元', '地址': '昆山周庄镇东浜村75号', '电话号码': '181-3619-1632', '评分': 4.8}",
                "{'名称': '周庄多瓦台临河客栈', '区域': '昆山', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '收费', '房费': '279元', '地址': '昆山周庄镇东浜村75号', '电话号码': '181-3619-1632', '评分': 4.8}",
                "{'名称': '常熟长江路亚朵酒店', '区域': '常熟', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '312元', '地址': '常熟长江路268号', '电话号码': '0512-51661666', '评分': 4.8}",
                "{'名称': '常熟长江路亚朵酒店', '区域': '常熟', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '312元', '地址': '常熟长江路268号', '电话号码': '0512-51661666', '评分': 4.8}",
                "{'名称': '维也纳酒店', '区域': '常熟', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '322元', '地址': '常熟碧溪镇金港路8号', '电话号码': '0512-52018188', '评分': 4.8}",
                "{'名称': '维也纳酒店', '区域': '常熟', '星级': '3', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '340元', '地址': '常熟碧溪镇金港路8号', '电话号码': '0512-52018188', '评分': 4.8}"
            ],
            "segmented_user_utterance": "哦 , 好 的 。 还有 酒店 , 帮 我 推荐 个 价位 中等 的 商务酒店 !",
            "segmented_system_utterance": "推荐 苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店 , 在 金鸡湖 景区 附近 。"
        },
        {
            "turn_id": 4,
            "turn_domain": [
                "酒店"
            ],
            "user_utterance": "你想得真周到!这家酒店有停车场吗?",
            "system_utterance": "酒店配备有一个免费的停车场。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行",
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn_inform": {
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn request": [
                    "停车场"
                ]
            },
            "user_actions": [
                [
                    "Inform",
                    "酒店",
                    "名称",
                    "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                ],
                [
                    "Request",
                    "酒店",
                    "停车场",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Inform",
                    "酒店",
                    "停车场",
                    "免费"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为2",
                "{'名称': '苏州金鸡湖李公堤瑞贝庭公寓酒店', '区域': '工业园区', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '438元', '地址': '苏州工业园区李公堤三期E区商业街9幢', '电话号码': '0512-69995666', '评分': 4.6}",
                "{'名称': '苏州金鸡湖李公堤瑞贝庭公寓酒店', '区域': '工业园区', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '438元', '地址': '苏州工业园区李公堤三期E区商业街9幢', '电话号码': '0512-69995666', '评分': 4.6}"
            ],
            "segmented_user_utterance": "你 想 得 真 周到 ! 这家 酒店 有 停车场 吗 ?",
            "segmented_system_utterance": "酒店 配备 有 一个 免费 的 停车场 。"
        },
        {
            "turn_id": 5,
            "turn_domain": [
                "酒店"
            ],
            "user_utterance": "酒店的电话告诉我一下。",
            "system_utterance": "电话号码:0512-69995666。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行",
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn_inform": {},
                "turn request": [
                    "电话号码"
                ]
            },
            "user_actions": [
                [
                    "Request",
                    "酒店",
                    "电话号码",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Inform",
                    "酒店",
                    "电话号码",
                    "0512 - 69995666"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为2",
                "{'名称': '苏州金鸡湖李公堤瑞贝庭公寓酒店', '区域': '工业园区', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '大床房', '停车场': '免费', '房费': '438元', '地址': '苏州工业园区李公堤三期E区商业街9幢', '电话号码': '0512-69995666', '评分': 4.6}",
                "{'名称': '苏州金鸡湖李公堤瑞贝庭公寓酒店', '区域': '工业园区', '星级': '4', '价位': '中等', '酒店类型': '商务出行', '房型': '标准间', '停车场': '免费', '房费': '438元', '地址': '苏州工业园区李公堤三期E区商业街9幢', '电话号码': '0512-69995666', '评分': 4.6}"
            ],
            "segmented_user_utterance": "酒店 的 电话 告诉 我 一下 。",
            "segmented_system_utterance": "电话号码 : 0512 - 69995666 。"
        },
        {
            "turn_id": 6,
            "turn_domain": [
                "餐厅"
            ],
            "user_utterance": "嗯,我还想拔草美食。有没有价位中等的江浙菜餐厅推荐一个。",
            "system_utterance": "推荐老枫庭。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "餐厅-菜系": "江浙 菜",
                    "餐厅-价位": "中等",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行",
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn_inform": {
                    "餐厅-菜系": "江浙 菜",
                    "餐厅-价位": "中等"
                },
                "turn request": []
            },
            "user_actions": [
                [
                    "Inform",
                    "餐厅",
                    "菜系",
                    "江浙 菜"
                ],
                [
                    "Inform",
                    "餐厅",
                    "价位",
                    "中等"
                ],
                [
                    "General",
                    "餐厅",
                    "",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Recommend",
                    "餐厅",
                    "名称",
                    "老枫庭"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为3",
                "{'名称': '老枫庭', '区域': '吴中区', '菜系': '江浙菜', '价位': '中等', '是否地铁直达': '否', '人均消费': '94元', '地址': '木渎灵天路55号芭提雅休闲娱乐广场5号楼', '电话号码': '0512-66277557', '评分': 4.6, '营业时间': '周一至周日 11:00-13:30 17:00-20:30', '推荐菜': '松鼠桂鱼'}",
                "{'名称': '同里老家', '区域': '吴江', '菜系': '江浙菜', '价位': '中等', '是否地铁直达': '否', '人均消费': '87元', '地址': '同里镇环湖西路318号', '电话号码': '0512-63339777', '评分': 4.5, '营业时间': '周一至周日 10:00-22:00', '推荐菜': '太湖三白'}",
                "{'名称': '周庄花间堂桔梗餐厅', '区域': '昆山', '菜系': '江浙菜', '价位': '中等', '是否地铁直达': '否', '人均消费': '98元', '地址': '周庄镇中市街110号景点迷楼北10米', '电话号码': '138-1289-9961', '评分': 4.5, '营业时间': '周一至周日 07:00-20:30', '推荐菜': '银鱼炒蛋'}"
            ],
            "segmented_user_utterance": "嗯 , 我 还 想 拔草 美食 。 有没有 价位 中等 的 江浙 菜 餐厅 推荐 一个 。",
            "segmented_system_utterance": "推荐 老枫庭 。"
        },
        {
            "turn_id": 7,
            "turn_domain": [
                "餐厅"
            ],
            "user_utterance": "这家餐厅地铁直达吗?",
            "system_utterance": "抱歉,餐厅没有地铁直达!",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "餐厅-菜系": "江浙 菜",
                    "餐厅-价位": "中等",
                    "餐厅-名称": "老枫庭",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行",
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn_inform": {
                    "餐厅-名称": "老枫庭"
                },
                "turn request": [
                    "是否地铁直达"
                ]
            },
            "user_actions": [
                [
                    "Inform",
                    "餐厅",
                    "名称",
                    "老枫庭"
                ],
                [
                    "Request",
                    "餐厅",
                    "是否地铁直达",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Inform",
                    "餐厅",
                    "是否地铁直达",
                    "否"
                ],
                [
                    "General",
                    "通用",
                    "",
                    ""
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为1",
                "{'名称': '老枫庭', '区域': '吴中区', '菜系': '江浙菜', '价位': '中等', '是否地铁直达': '否', '人均消费': '94元', '地址': '木渎灵天路55号芭提雅休闲娱乐广场5号楼', '电话号码': '0512-66277557', '评分': 4.6, '营业时间': '周一至周日 11:00-13:30 17:00-20:30', '推荐菜': '松鼠桂鱼'}"
            ],
            "segmented_user_utterance": "这家 餐厅 地铁 直达 吗 ?",
            "segmented_system_utterance": "抱歉 , 餐厅 没有 地铁 直达 !"
        },
        {
            "turn_id": 8,
            "turn_domain": [
                "餐厅"
            ],
            "user_utterance": "人均消费呢?",
            "system_utterance": "老枫庭人均消费在94元左右。",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "餐厅-菜系": "江浙 菜",
                    "餐厅-价位": "中等",
                    "餐厅-名称": "老枫庭",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行",
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn_inform": {},
                "turn request": [
                    "人均消费"
                ]
            },
            "user_actions": [
                [
                    "Request",
                    "餐厅",
                    "人均消费",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Inform",
                    "餐厅",
                    "人均消费",
                    "老枫庭"
                ]
            ],
            "db_results": [
                "数据库检索结果:成功匹配个数为1",
                "{'名称': '老枫庭', '区域': '吴中区', '菜系': '江浙菜', '价位': '中等', '是否地铁直达': '否', '人均消费': '94元', '地址': '木渎灵天路55号芭提雅休闲娱乐广场5号楼', '电话号码': '0512-66277557', '评分': 4.6, '营业时间': '周一至周日 11:00-13:30 17:00-20:30', '推荐菜': '松鼠桂鱼'}"
            ],
            "segmented_user_utterance": "人均 消费 呢 ?",
            "segmented_system_utterance": "老枫庭 人均 消费 在 94 元 左右 。"
        },
        {
            "turn_id": 9,
            "turn_domain": [
                "通用"
            ],
            "user_utterance": "好,所有问题都解决了,谢谢你的帮助!再见!",
            "system_utterance": "不客气!这是我应该做的!再见!",
            "belief_state": {
                "inform slot-values": {
                    "旅游景点-景点类型": "山水 景区",
                    "旅游景点-消费": "偏贵",
                    "旅游景点-名称": "金鸡湖 景区",
                    "餐厅-菜系": "江浙 菜",
                    "餐厅-价位": "中等",
                    "餐厅-名称": "老枫庭",
                    "酒店-价位": "中等",
                    "酒店-酒店类型": "商务 出行",
                    "酒店-名称": "苏州 金鸡湖 李公堤 瑞贝庭 公寓 酒店"
                },
                "turn_inform": {},
                "turn request": []
            },
            "user_actions": [
                [
                    "Bye",
                    "通用",
                    "",
                    ""
                ],
                [
                    "General",
                    "通用",
                    "",
                    ""
                ]
            ],
            "system_actions": [
                [
                    "Bye",
                    "通用",
                    "",
                    ""
                ],
                [
                    "General",
                    "通用",
                    "",
                    ""
                ]
            ],
            "db_results": [],
            "segmented_user_utterance": "好 , 所有 问题 都 解决 了 , 谢谢 你 的 帮助 ! 再见 !",
            "segmented_system_utterance": "不 客气 ! 这 是 我 应该 做 的 ! 再见 !"
        }
    ]
}

GEM中的数据集

纳入GEM的原因

为何将数据集纳入GEM中?

RiSAWOZ是第一个具有丰富语义注释的大规模多领域中文Wizard-of-Oz数据集。

类似的数据集

是的

唯一的语言覆盖范围

与其他GEM数据集的区别

该语料库除了传统的对话注释(对话状态,对话行为等)外,还包含了丰富的语义注释,例如省略和共指,可用于对话系统中的各种任务。

数据集所测量的能力

自然语言理解,对话状态跟踪,对话上下文到文本生成,共指消解,统一生成省略与共指消解

GEM特定策划

是否为GEM修改?

是否有其他拆分?

开始任务

资源指针

Website

专业术语
  • 在任务导向型对话系统中,自然语言理解(NLU)模块旨在将用户话语转换为计算机可以理解的表示,包括意图和对话行为(插槽和值)检测。
  • 对话状态跟踪(DST)是任务导向型对话系统的核心组件,它提取嵌入在对话上下文中的对话状态(用户目标)。现已发展到开放词汇表或生成式DST,其中最先进的模型可以直接从对话上下文生成对话状态。
  • 上下文到文本生成:将对话上下文编码为解码系统回复。
  • 共指消解:预测指向同一实体的共指簇,每个对话都有。
  • 统一生成省略和共指消解:从对话上下文生成省略或引用表达式。

以前的结果

以前的结果

选择度量模型能力

自然语言理解,对话状态跟踪,对话上下文到文本生成,共指消解,统一生成省略和共指消解

指标

其他:其他指标

其他指标
  • 自然语言理解:
    • F1得分:用户意图的F1得分。
  • 对话状态跟踪:
    • 共同准确度:轮次级别的对话状态准确度。
  • 对话上下文到文本生成:
    • 提示率:输出包含用户所请求的适当实体的百分比。
    • 成功率:估计已回答所有请求属性的比例。
    • BLEU:生成的系统回复的BLEU得分。
    • 综合得分:(inform + success)* 0.5 + BLEU,作为总体质量。
  • 共指消解:
    • MUC F1得分:基于链接的度量。在同一实体/簇中的提及被视为“链接”。MUC惩罚缺失的链接和错误的链接,每个链接权重相同。
    • B3 F1得分:基于提及的度量。评估得分取决于包含在响应实体(即系统创建的实体)中的正确提及的分数。
    • CEAFφ4 F1 Score:一种度量,假设每个关键实体只能映射到一个响应实体,反之亦然。它将关键实体(簇)与响应实体以最佳方式对齐,并从该对齐中计算得分。
    • 平均F1得分:上述三个指标的平均F1得分。
  • 统一生成省略和共指消解:
    • 精确匹配率:衡量生成的话语是否与基本事实话语完全匹配。
    • BLEU:生成话语的BLEU得分
    • 解析F1:仅从用户话语的省略/共指部分与基本真值话语的单词进行比较。
提议的评估

参见“其他指标定义”

以前的结果是否可用?

是的

其他评价方法

与我们的数据集相同

相关的以前的结果

MultiWOZ和CrossWOZ数据集上的联合准确度,提示率,成功率,BLEU得分和综合得分。

数据集策划

原始策划

原始策划理由

收集人对人的中文对话。

交流目标

在给定对话上下文的情况下生成系统回复,涵盖多个领域。

来源于不同来源

语言数据

语言数据如何获得?

众包

众包来源

其他众包平台

涵盖的主题

领域:景点,餐馆,酒店,航班,火车,天气,电影,电视,计算机,汽车,医院,课程

数据验证

由数据策划师验证

是否过滤了数据?

混合

过滤条件

基于规则和手动选择标准

结构化注释

附加注释?

众包

评分人数

51< n