动态量化的DistilBERT基础版本（未分大小写）在SST-2数据集上微调

模型详情

模型描述: 该模型是在SST-2数据集上进行微调的，通过使用动态量化的方式将Fine-Tuned的模型进行了压缩。

模型类型: 文本分类
语言: 英文
授权许可: Apache-2.0
原始模型: 更多详情请参考原始模型 this 的相关信息。

如何开始使用模型

PyTorch

要加载量化模型，可以按照以下步骤进行：

from optimum.intel.neural_compressor.quantization import IncQuantizedModelForSequenceClassification

model = IncQuantizedModelForSequenceClassification.from_pretrained("Intel/distilbert-base-uncased-finetuned-sst-2-english-int8-dynamic")

ONNX

这是使用 Intel® Neural Compressor 将模型量化为INT8的ONNX模型。

原始的fp32模型基于Fine-Tuned的模型 DistilBERT 。

测试结果

INT8	FP32
Accuracy (eval-accuracy)	0.9025	0.9106
Model size (MB)	165	256

加载ONNX模型：

from optimum.onnxruntime import ORTModelForSequenceClassification
model = ORTModelForSequenceClassification.from_pretrained('Intel/distilbert-base-uncased-finetuned-sst-2-english-int8-dynamic')

作者:

Intel

数据集大小:

205.76 MB

动态量化的DistilBERT基础版本（未分大小写）在SST-2数据集上微调

目录

模型详情

如何开始使用模型

PyTorch

ONNX