ELETRA 冒犯性模型可侦测丹麦文本是否带有冒犯成分。它基于预训练的丹麦 Ælæctra 模型。
请参阅 DaNLP documentation 获取更多详细信息。
使用该模型的方法如下:
from transformers import ElectraTokenizer, ElectraForSequenceClassification model = ElectraForSequenceClassification.from_pretrained("alexandrainst/da-hatespeech-detection-small") tokenizer = ElectraTokenizer.from_pretrained("alexandrainst/da-hatespeech-detection-small")
用于训练的数据尚未公开。它是通过与丹麦广播公司的合作,手动标注的社交媒体数据。