模型:

phob0s/bert-tiny

英文

测试克隆 https://huggingface.co/prajjwal1/bert-tiny

提到于

  • NLI中的泛化:超越简单启发式方法的方法(Bhargava、Drozd和Rogers)
  • 学有所闻的学生学得更好:学生初始化对知识蒸馏的影响(Turc等)