模型:
allenai/bidaf-elmo
这是一个使用ELMo嵌入的BiDAF模型的实现。基本布局非常简单:将词编码为词嵌入和字符级编码器的组合,通过双向LSTM / GRU将词表示传递,使用注意力矩阵将问题信息纳入段落词表示(这是唯一一部分与标准不同的部分),将此通过另外几层双向LSTM / GRU传递,并在跨度开始和跨度结束上进行softmax。
该模型基于ELMo。ELMo不是确定性的,这意味着每次运行时可能会稍有不同。此外,ELMo喜欢预热,因此我们建议在处理真实负载之前先处理虚拟输入。