机器翻译的Ohsumed集合(从英文到印度尼西亚语)
原始语料库: http://disi.unitn.it/moschitti/corpora.htm 使用的翻译工具: https://huggingface.co/Helsinki-NLP/opus-mt-en-id
与HuggingFace文本分类脚本兼容(在4.17中测试过) https://github.com/huggingface/transformers/tree/v4.17.0/examples/pytorch/text-classification
[Moschitti, 2003a]. Alessandro Moschitti,自然语言处理和文本分类:关于相互有益的交互的研究,博士论文,罗马大学托尔韦尔加塔,意大利罗马,2003年5月。