数据集:
bigbio/bioasq_task_b
BioASQ语料库包含多个由生物医学专家进行注释的问答任务,包括是/否、事实型、列表型和摘要型问题。针对我们比较神经语言模型的目标,我们重点关注是/否问题(任务7b),将其他任务的包含留给未来的工作。每个问题都与一个参考文本配对,该文本包含来自PubMed摘要的多个句子以及一个是/否答案。我们使用官方的训练/开发/测试分割,共有670/75/140个问题。
请参阅《面向生物医学自然语言处理的领域特定语言模型预训练》
@article{tsatsaronis2015overview, title = { An overview of the BIOASQ large-scale biomedical semantic indexing and question answering competition }, author = { Tsatsaronis, George and Balikas, Georgios and Malakasiotis, Prodromos and Partalas, Ioannis and Zschunke, Matthias and Alvers, Michael R and Weissenborn, Dirk and Krithara, Anastasia and Petridis, Sergios and Polychronopoulos, Dimitris and others }, year = 2015, journal = {BMC bioinformatics}, publisher = {BioMed Central Ltd}, volume = 16, number = 1, pages = 138 }