数据集:
notional/notional-python
子任务:
language-modeling语言:
py计算机处理:
monolingual大小:
10K<n<100K语言创建人:
found批注创建人:
no-annotation源数据集:
original许可:
license:unknownnotional-python 数据集包含来自Google Bigquery Github数据集的100个知名存储库的Python代码文件。该数据集的创建是为了测试编程语言模型的能力。点击 our repo 了解使用notional-python数据集进行模型评估的详情。
Python
notional-python 数据集旨在为测试机器生成Python代码的能力提供数据集。
过滤了来自 Google Bigquery Github data 的代码以获得数据。为了提高数据集的质量,只有满足以下条件的Python代码文件才被添加到数据集中:
语言生产者是 GitHub 的用户。