数据集:
SuperAI2-Machima/ThaiQA_LST20
SuperAI Engineer Season 2 , Machima
Machima_ThaiQA_LST20是从LST20数据集中提取问题和答案的数据集,总共提取到7642个问题-答案对,数据有4个列,分别是context、question、answer和status。
以下是一个示例:context: ด.ต.ประสิทธิ์ ชาหอมชื่นอายุ 55 ปี ผบ.หมู่งาน ป.ตชด. 24 อุดรธานีถูกยิงด้วยอาวุธปืนอาก้าเข้าที่แขนซ้าย 3 นัดหน้าท้อง 1 นัดส.ต.อ.ประเสริฐ ใหญ่สูงเนินอายุ 35 ปี ผบ.หมู่กก. 1 ปส.2 บช.ปส. ถูกยิงเข้าที่แขนขวากระดูกแตกละเอียดร.ต.อ.ชวพล หมื่นโรจน์อายุ 32 ปีรอง สว.กก. 1 ปส. 2 บช.ปส. ถูกยิงเข้าที่แก้มและไหปลาร้าด้านขวาquestion :ผบ.หมู่งาน ป.ตชด. 24 อุดรธานี ถูกยิงด้วยอาวุธปืนอะไรเข้าที่แขนซ้าย 3 นัดหน้าท้อง answer : อาวุธปืนอาก้าstatus : 1
在7642个问题中,有4438个问题-答案对是正确的,3204个问题-答案对是不正确的,例如回答不符合问题,或者答案在问题句子中。我们的团队已经对问题-答案对进行了检查,并对正确和不正确的问题-答案对进行了标注,其中1表示正确,0表示不正确。
您可以使用以下代码下载数据:
!pip install datasets -qq #สำหรับโหลดdataset from datasets import load_dataset import pandas as pd dataset = load_dataset("SuperAI2-Machima/ThaiQA_LST20") train_df = pd.DataFrame(dataset['train']) train_df