模型:
deepset/deberta-v3-base-injection
此模型是在 promp-injection 数据集上对 microsoft/deberta-v3-base 进行微调得到的。在评估数据集上取得以下结果:
此模型用于检测注入攻击,并将其分类为"INJECTION"。合法的请求会被分类为"LEGIT"。数据集假设合法的请求为各种问题或关键字搜索。
如果您使用此模型来保护系统,并且它在将请求分类为注入攻击方面过于"敏感",请考虑收集合法示例,并使用 promp-injection 数据集重新训练模型。
基于 promp-injection 数据集。
训练过程中使用了以下超参数:
Training Loss | Epoch | Step | Validation Loss | Accuracy |
---|---|---|---|---|
No log | 1.0 | 69 | 0.2353 | 0.9741 |
No log | 2.0 | 138 | 0.0894 | 0.9741 |
No log | 3.0 | 207 | 0.0673 | 0.9914 |