数据集:
codeparrot/github-jupyter
该数据集从BigQuery中的Jupyter Notebooks中提取而来。
每个示例都有其关联存储库的许可证。总共有15个许可证:
[
'mit',
'apache-2.0',
'gpl-3.0',
'gpl-2.0',
'bsd-3-clause',
'agpl-3.0',
'lgpl-3.0',
'lgpl-2.1',
'bsd-2-clause',
'cc0-1.0',
'epl-1.0',
'mpl-2.0',
'unlicense',
'isc',
'artistic-2.0'
]