模型:
neulab/codebert-python
这是一个 microsoft/codebert-base-mlm 模型,使用 batch_size=32 ,从 codeparrot/github-code-clean 数据集中的 Python 代码上进行了 1,000,000 步的训练,用于掩码语言建模任务。
它旨在用于 CodeBERTScore: https://github.com/neulab/code-bert-score ,但也可以用于任何其他模型或任务。
更多信息,请参阅: https://github.com/neulab/code-bert-score
@article{zhou2023codebertscore,
url = {https://arxiv.org/abs/2302.05527},
author = {Zhou, Shuyan and Alon, Uri and Agarwal, Sumit and Neubig, Graham},
title = {CodeBERTScore: Evaluating Code Generation with Pretrained Models of Code},
publisher = {arXiv},
year = {2023},
}