数据集:
imodels/diabetes-readmission
从UCI(链接 here )导入了糖尿病复发数据集。请注意详细信息并小心使用。
由 imodels team 做了基本的预处理。
目标是二元结果"readmitted"。
加载数据:
from datasets import load_dataset dataset = load_dataset("imodels/diabetes-readmission") df = pd.DataFrame(dataset['train']) X = df.drop(columns=['readmitted']) y = df['readmitted'].values
拟合模型:
import imodels import numpy as np m = imodels.FIGSClassifier(max_rules=5) m.fit(X, y) print(m)
评估:
df_test = pd.DataFrame(dataset['test']) X_test = df.drop(columns=['readmitted']) y_test = df['readmitted'].values print('accuracy', np.mean(m.predict(X_test) == y_test))