数据集:

albertvillanova/medmnist-v2

英文

MedMNIST v2 数据集卡片

数据集摘要

我们介绍了 MedMNIST v2,这是一个大规模的类似于MNIST的标准化生物医学图像集合,包括12个2D数据集和6个3D数据集。所有图像都经过预处理,变为28 x 28(2D)或 28 x 28 x 28(3D),并具有相应的分类标签,因此用户不需要背景知识。MedMNIST v2覆盖了生物医学图像中的主要数据模态,旨在对轻量级的2D和3D图像进行多样化的数据规模(100到100,000)和多种任务(二元/多类、有序回归和多标签)的分类。最终的数据集共计包含708,069个2D图像和9,998个3D图像,可在生物医学图像分析、计算机视觉和机器学习的众多研究/教育目的上提供支持。我们在MedMNIST v2上进行了几种基准方法的评估,包括2D / 3D神经网络和开源/商业自动机器学习工具。

支持的任务和排行榜

[需要更多信息]

语种

英语 (en)

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据集划分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

数据源

初始数据收集和标准化

[需要更多信息]

数据源语言的制作者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

数据集的许可证为 Creative Commons Attribution 4.0 International (CC BY 4.0)。

每个子数据集都采用与源数据集相同的许可证。如果您使用MedMNIST的任何子集,请同时引用相应的源数据的论文。

引用信息

如果您发现此项目有用,请同时引用v1和v2的论文:

@article{medmnistv2,
    title={MedMNIST v2-A large-scale lightweight benchmark for 2D and 3D biomedical image classification},
    author={Yang, Jiancheng and Shi, Rui and Wei, Donglai and Liu, Zequan and Zhao, Lin and Ke, Bilian and Pfister, Hanspeter and Ni, Bingbing},
    journal={Scientific Data},
    volume={10},
    number={1},
    pages={41},
    year={2023},
    publisher={Nature Publishing Group UK London}
}

@inproceedings{medmnistv1,
    title={MedMNIST Classification Decathlon: A Lightweight AutoML Benchmark for Medical Image Analysis},
    author={Yang, Jiancheng and Shi, Rui and Ni, Bingbing},
    booktitle={IEEE 18th International Symposium on Biomedical Imaging (ISBI)},
    pages={191--195},
    year={2021}
}

如需使用MedMNIST的任何子集,请按 project website 上的描述引用相应的源数据的论文。

贡献者

感谢 @albertvillanova 添加了这个数据集。