数据集:
bsd_ja_en
任务:
翻译计算机处理:
translation大小:
10K<n<100K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
original许可:
cc-by-nc-sa-4.0这是 Business Scene Dialogue(BSD)数据集,一个包含了各种商业场景的日英平行语料库,其中包含了书面对话。
该数据集经过了以下3个步骤的构建:
一半的单语对话情景用日语编写,另一半用英语编写。
[需要更多信息]
英语,日语。
每个实例包含一个对话标识符、表示其在对话中的位置的句子编号、英语和日语中的发言者姓名、英语和日语中的文本、原始语言、情景标签以及情景标题。
{ "id": "190315_E004_13", "no": 14, "speaker": "Mr. Sam Lee", "ja_speaker": "サム リーさん", "en_sentence": "Would you guys consider a different scheme?", "ja_sentence": "別の事業案も考慮されますか?", "original_language": "en", "tag": "phone call", "title": "Phone: Review spec and scheme" }
[需要更多信息]
[需要更多信息]
谁是源语言的生成者?[需要更多信息]
[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
此数据集仅供研究目的使用。请查看数据集许可证以获取更多信息。
[需要更多信息]
该数据集采用Creative Commons Attribution-NonCommercial-ShareAlike(CC BY-NC-SA)许可协议发布。
@inproceedings{rikters-etal-2019-designing, title = "Designing the Business Conversation Corpus", author = "Rikters, Mat{\=\i}ss and Ri, Ryokan and Li, Tong and Nakazawa, Toshiaki", booktitle = "Proceedings of the 6th Workshop on Asian Translation", month = nov, year = "2019", address = "Hong Kong, China", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/D19-5204", doi = "10.18653/v1/D19-5204", pages = "54--61" }
感谢 @j-chim 添加了这个数据集。