数据集:
id_panl_bppt
任务:
翻译计算机处理:
translation大小:
10K<n<100K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
original许可:
license:unknown这是由BPPT(印尼技术评估与应用机构)为PAN本地化项目(亚洲地区发展本地语言计算能力的区域性倡议)创建的用于多领域翻译系统的平行文本语料库。该数据集包含约24K个句子,分为4个不同主题(经济、国际、科学技术和体育)。
[需要更多信息]
印度尼西亚语
[需要更多信息]
数据集的一个示例:
{ 'id': '0', 'topic': 0, 'translation': { 'en': 'Minister of Finance Sri Mulyani Indrawati said that a sharp correction of the composite inde x by up to 4 pct in Wedenesday?s trading was a mere temporary effect of regional factors like decline in plantation commodity prices and the financial crisis in Thailand.', 'id': 'Menteri Keuangan Sri Mulyani mengatakan koreksi tajam pada Indeks Harga Saham Gabungan IHSG hingga sekitar 4 persen dalam perdagangan Rabu 10/1 hanya efek sesaat dari faktor-faktor regional seperti penurunan harga komoditi perkebunan dan krisis finansial di Thailand.' } }
该数据集被分为训练集、验证集和测试集。
[需要更多信息]
[需要更多信息]
语言源头制作人是谁?[需要更多信息]
[需要更多信息]
注解者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{id_panl_bppt, author = {PAN Localization - BPPT}, title = {Parallel Text Corpora, English Indonesian}, year = {2009}, url = {http://digilib.bppt.go.id/sampul/p92-budiono.pdf}, }
感谢 @cahya-wirawan 添加了这个数据集。