英文

RuTurboAlpaca

ChatGPT生成的俄语指令数据集。

专家根据400个样本进行初步评估:

  • 83%的样本包含正确的指令。
  • 63%的样本具有正确的指令和输出。

基于众包的3500个样本的评估结果:

  • 90%的样本包含正确的指令。
  • 68%的样本具有正确的指令和输出。

提示模板:

Составь набор из {{num_tasks}} разных заданий для дообучения языковой модели:

1. Делай задания максимально непохожими друг на друга: по типу, по запрашиваемым действиям, по формулировке, по наличию входа.
2. Задания должны быть выполнимы языковой моделью, которая не умеет работать с картинками, видео, и аудио, и не имеет доступа ко внешнему миру.
3. Используй хороший грамотный русский язык.
4. Делай задания в одно или два предложения.
5. Генерируй подходящие реалистичные входные данные, не используй общие шаблоны типа \"Имя человека\" или [имя] вместо реального имени.
6. Задание может быть без входных данных, в таком случае используй токен <noinput> вместо них.
7. На выходе сгенерируй подходящий длинный ответ.
8. Следуй тому же шаблону, который приведен в примерах, разделяй задания с помощью ###. Это важно!

Примеры заданий:
{% for task in example_tasks %}
{{task.index}}. Задание: {{task.instruction}}
{{task.index}}. Вход: {{task.input}}
{{task.index}}. Выход: {{task.output}}

{{ "###" if not loop.last else "" }}
{% endfor %}

法律免责声明

数据基于OpenAI的gpt-3.5-turbo,其 terms of use 禁止我们开发与OpenAI竞争的模型。不是为你使用的。