登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

数据集:

bigcode/ta-prompt

语言:

许可:

数据集介绍文件清单

数据集概述

这个代码仓库是用于进行上下文学习的提示，与 starcoder 进行训练。实际上，该模型是一个自回归语言模型，它在代码和自然语言文本上进行训练。通过在其8192个标记的上下文窗口前添加对话，可以将其转化为一个基于人工智能的技术助手。

格式

提示是一个包含人与助手之间多个对话的.txt文件。这是格式

-----
Human: <instruction>
Assistant: <answer>

-----

Human: <instruction>
Assistant: <answer>
Human: <instruction>
Assistant: <answer>
.
.
.
-----

使用情况

我们希望技术助手涵盖多种用例

Code-to-text：
- 以下代码的目的是什么？<code>
- 以下代码的错误是什么？<code>
Text-to-code：
- 编写/设计/实现一个函数，用于<task>
Code-to-code：
- 将此<programming language>中的<code>翻译成<programming language>。
Text-to-text：
- 什么是<technical concept>
通用问答
- 你是谁？
- 你的目的是什么？

工作范围

作为一个针对编码任务设计的模型，当用户提出通用问题时，不应期望模型输出相关答案。当涉及到编码请求时，模型的输出应该在测试之前进行后处理。

作者:

bigcode

数据集大小:

25.25 KB

相关推荐