日本语自然语言推理模型

该模型使用 SentenceTransformers Cross-Encoder 类进行训练，并使用来自 CyberAgentAILab/japanese-nli-model 的代码逐步训练。

训练数据

该模型使用 JGLUE-JNLI 和 JSICK 数据集进行训练。对于给定的句子对，它将输出三个得分对应于标签：否定、蕴含、中立。

用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained('cyberagent/xlm-roberta-large-jnli-jsick')
model = AutoModelForSequenceClassification.from_pretrained('cyberagent/xlm-roberta-large-jnli-jsick')
features = tokenizer(["子供が走っている猫を見ている", "猫が走っている"], ["猫が走っている", "子供が走っている"], padding=True, truncation=True, return_tensors="pt")
model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

作者:

CyberAgent

数据集大小:

2.11 GB