数据集:
mstz/toxicity
来自 UCI ML repository 的 Toxicity dataset 。该数据集包括171个分子,设计用于核心时钟蛋白CRY1的功能域,该蛋白负责产生昼夜节律。
Configuration | Task | Description |
---|---|---|
toxicity | Binary classification | Is the molecule toxic? |
from datasets import load_dataset dataset = load_dataset("mstz/toxicity")["train"]