数据集:

msarmi9/korean-english-multitarget-ted-talks-task

语言:

en ko

语言创建人:

other

批注创建人:

expert-generated
英文

英韩多目标TED演讲任务的数据集卡片

数据集摘要

  • 并行的英韩文本语料库
  • 文本最初是从各种TED演讲中以英文转录的,然后由TED的翻译人员翻译成韩文
  • 大约有16.6万个训练句对,2千个验证句对和2千个测试句对

支持的任务和排行榜

  • 机器翻译

语言

  • 英文
  • 韩文

附加信息

数据集策展人

Kevin Duh, "The Multitarget TED Talks Task", http://www.cs.jhu.edu/~kevinduh/a/multitarget-tedtalks/ , 2018

许可信息

TED根据创作共用的BY-NC-ND许可协议提供其收藏。在使用这些数据时,请承认TED的贡献。我们承认TED演讲的作者身份(BY条件)。我们不会为商业目的重新分发这些文字记录(NC条件),也不会对原始内容进行创作衍生作品(ND条件)。

引用信息

@misc{duh18multitarget, author = {Kevin Duh}, title = {The Multitarget TED Talks Task}, howpublished = {\url{ http://www.cs.jhu.edu/~kevinduh/a/multitarget-tedtalks/}} , year = {2018},}