英文

? bert-restore-punctuation-ptbr

这是一个经过微调的模型,用于恢复葡萄牙语的标点符号。

这个模型旨在作为恢复葡萄牙语常规文本的标点符号恢复模型直接使用。或者,您可以将其用于进一步微调以用于标点符号恢复任务的领域特定文本。

模型恢复以下标点符号 - [! ? . , - : ; ' ]

模型还会恢复单词的大写形式。

? 使用方法

?? 用于恢复葡萄牙语文本标点符号的易于使用的包。

以下是使用模板的快速方法。

  • 首先,安装该包。
  • pip install respunct
    
  • 示例Python代码。
  • from respunct import RestorePuncts
    
    model = RestorePuncts()
    
    model.restore_puncts("""
    henrique foi no lago pescar com o pedro mais tarde foram para a casa do pedro fritar os peixes""")
    # output:
    # Henrique foi no lago pescar com o Pedro. Mais tarde, foram para a casa do Pedro fritar os peixes.
    

    ? 准确性

    label precision recall f1-score support
    Upper - OU 0.89 0.91 0.90 69376
    None - OO 0.99 0.98 0.98 857659
    Full stop/period - .O 0.86 0.93 0.89 60410
    Comma - ,O 0.85 0.83 0.84 48608
    Upper + Comma - ,U 0.73 0.76 0.75 3521
    Question - ?O 0.68 0.78 0.73 1168
    Upper + period - .U 0.66 0.72 0.69 1884
    Upper + colon - :U 0.59 0.63 0.61 352
    Colon - :O 0.70 0.53 0.60 2420
    Question Mark - ?U 0.50 0.56 0.53 36
    Upper + Exclam. - !U 0.38 0.32 0.34 38
    Exclamation Mark - !O 0.30 0.05 0.08 783
    Semicolon - ;O 0.35 0.04 0.08 1557
    Apostrophe - 'O 0.00 0.00 0.00 3
    Hyphen - -O 0.00 0.00 0.00 3
    accuracy 0.96 1047818
    macro avg 0.57 0.54 0.54 1047818
    weighted avg 0.96 0.96 0.96 1047818

    ? 联系方式

    Maicon Domingues 有关问题、反馈和/或类似模型的请求,请联系。