数据集:

Thaweewat/alpaca-finance-43k-th

英文

概要

?? 通过Google Cloud翻译,将用泰语指导的数据集从 gbharti/wealth-alpaca_lora 进行翻译。该数据集是斯坦福大学的Alpaca( https://github.com/tatsu-lab/stanford_alpaca )和FiQA( https://sites.google.com/view/fiqa/ )的组合,另外还使用GPT3.5Script生成了1.3k对自定义数据,并通过Kaggle( https://www.kaggle.com )的免费资源使用PEFT/LoRa进行微调。

支持的任务:

  • 训练LLMs
  • 合成数据生成
  • 数据增强

语言: 泰语 版本: 1.0