模型:
cafeai/cafe_aesthetic
因为人们正在下载这个模型,而我不知道为什么,所以我将添加一些信息。该模型是在 microsoft/beit-base-patch16-384 上进行微调的图像分类器。它的目的是用于《 Waifu Diffusion project 》的数据集调整步骤,这是一个用于稳定扩散的微调工作。由于WD1.4计划具有一个非常庞大的数据集(约1500万张图像),无法通过手动分析每个图像来确定是否应该包含在最终的训练数据集中。这个图像分类器是在约3.5k个真实生活和动漫/漫画图像上进行训练的。它的目的是通过将它们分类为"not_aesthetic"来从我们的数据集中删除审美上没有价值的图像。图像分类器在判断时倾向于包含图像,除非它们是"漫画风格"的、具有杂乱的线条和/或是草图,或者包含了不可接受数量的文本(即覆盖了图像主题的文本)。这样做的想法是,某些图像会对SD微调造成伤害。
注意:这个分类器并不完美,就像其他所有分类器一样。然而,有一个足够大的数据集,任何不完美或错误分类应该会因为大数定律而平均自己出来。
您可以测试 here 及其他项目的一些分类器。
根据AGPLv3发布。任何目的都可以自由使用该模型。如果您进行了更改,请共享您的更改。