模型:

deepset/deberta-v3-base-injection

英文

deberta-v3-base-injection

此模型是在 promp-injection 数据集上对 microsoft/deberta-v3-base 进行微调得到的。在评估数据集上取得以下结果:

  • 损失:0.0673
  • 准确率:0.9914

模型描述

此模型用于检测注入攻击,并将其分类为"INJECTION"。合法的请求会被分类为"LEGIT"。数据集假设合法的请求为各种问题或关键字搜索。

使用限制

如果您使用此模型来保护系统,并且它在将请求分类为注入攻击方面过于"敏感",请考虑收集合法示例,并使用 promp-injection 数据集重新训练模型。

训练和评估数据

基于 promp-injection 数据集。

训练过程

训练超参数

训练过程中使用了以下超参数:

  • learning_rate: 2e-05
  • train_batch_size: 8
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam,betas=(0.9,0.999),epsilon=1e-08
  • lr_scheduler_type: linear
  • num_epochs: 3

训练结果

Training Loss Epoch Step Validation Loss Accuracy
No log 1.0 69 0.2353 0.9741
No log 2.0 138 0.0894 0.9741
No log 3.0 207 0.0673 0.9914

框架版本

  • Transformers 4.29.1
  • Pytorch 2.0.0+cu118
  • Datasets 2.12.0
  • Tokenizers 0.13.3