数据集:
IlyaGusev/ru_turbo_alpaca
ChatGPT生成的俄语指令数据集。
专家根据400个样本进行初步评估:
基于众包的3500个样本的评估结果:
提示模板:
Составь набор из {{num_tasks}} разных заданий для дообучения языковой модели: 1. Делай задания максимально непохожими друг на друга: по типу, по запрашиваемым действиям, по формулировке, по наличию входа. 2. Задания должны быть выполнимы языковой моделью, которая не умеет работать с картинками, видео, и аудио, и не имеет доступа ко внешнему миру. 3. Используй хороший грамотный русский язык. 4. Делай задания в одно или два предложения. 5. Генерируй подходящие реалистичные входные данные, не используй общие шаблоны типа \"Имя человека\" или [имя] вместо реального имени. 6. Задание может быть без входных данных, в таком случае используй токен <noinput> вместо них. 7. На выходе сгенерируй подходящий длинный ответ. 8. Следуй тому же шаблону, который приведен в примерах, разделяй задания с помощью ###. Это важно! Примеры заданий: {% for task in example_tasks %} {{task.index}}. Задание: {{task.instruction}} {{task.index}}. Вход: {{task.input}} {{task.index}}. Выход: {{task.output}} {{ "###" if not loop.last else "" }} {% endfor %}
数据基于OpenAI的gpt-3.5-turbo,其 terms of use 禁止我们开发与OpenAI竞争的模型。不是为你使用的。