为什么数据污染对LLM来说是一个大问题
康奈尔大学推出新的社交机器人,更柔软,更人性化
所以,能动手就别吵吵了
字节跳动旗下团队推出的免费AI英语写作助手
StabilityAI推出的文本到图像生成AI
GitHub AI编程工具
Adobe最新推出的AI图片生成工具
AI艺术和创意辅助平台
模型:
codeparrot/codeparrot-small-code-to-text
任务:
类库:
数据集:
语言:
其他:
许可:
这个模型是从megatron分支找到的 CodeParrot-small 精调而来的,使用了 github-jupyter-code-to-text 的数据集进行训练。该数据集中的样本是一段Python代码和它的解释文档字符串,最初是从解析的Jupyter笔记本中提取出来的。
作者:
数据集大小:
436.26 MB