英文

任务

为俄语笑话生成任务创建模型。从头开始生成笑话是非常困难的任务。为了简化它,笑话被分割成设定和反讽对。每个设定可以产生无限数量的反讽,因此引入了灵感,即给定设定的反讽的主要思想(或主要词)。在现实世界中,笑话有不同的质量(糟糕的、好笑的、有趣的...)。因此,为了使模型能够区分它们,引入了一个分数。它的范围从0(不是笑话)到5(黄金笑话)。

信息

使用FLAX在巨大的笑话和笑话数据集上训练的模型,用于不同的任务:

  • 跨度屏蔽(数据集大小:85万)
  • 条件生成任务(同时进行):a. 根据给定的设定生成灵感(数据集大小:23万)b. 根据给定的设定和灵感生成反讽(数据集大小:24万)c. 根据给定的设定和反讽生成评分(数据集大小:20万)
  • 伦理考虑和风险

    该模型是在从网站/电报渠道中爬取的大量幽默文本数据上进行微调的,包括笑话、短语和笑话。文本没有经过筛选来过滤出明确的内容或评估现有的偏见。因此,模型本身有可能生成同等不恰当的内容或复制基础数据中的固有偏见。请不要认真对待。