模型:
microsoft/swin-base-simmim-window6-192
预印本库:
arxiv:2111.09886许可:
apache-2.0Swin Transformer 模型在分辨率为192x192的图像网数据集(ImageNet-1k)上使用SimMIM目标进行预训练。该模型由Xie等人在论文 SimMIM: A Simple Framework for Masked Image Modeling 中提出,并在 this repository 首次发布。
此模型仅进行预训练,旨在在下游数据集上进行微调。
详情请参阅 documentation 。