为什么数据污染对LLM来说是一个大问题
康奈尔大学推出新的社交机器人,更柔软,更人性化
所以,能动手就别吵吵了
字节跳动旗下团队推出的免费AI英语写作助手
StabilityAI推出的文本到图像生成AI
GitHub AI编程工具
Adobe最新推出的AI图片生成工具
AI艺术和创意辅助平台
模型:
FredZhang7/danbooru-tag-generator
任务:
类库:
数据集:
语言:
其他:
许可:
Danbooru 存储了数百万张标记的动漫图片,但它没有过滤出不适宜内容的方式。该模型是在具有3个epochs中 up_score ≥ 3 的10万个标签上进行训练的,因此某些标签可能包含不适宜内容的描述。请谨慎使用。感谢您的合作。
有关数据预处理、提示工程等详细信息,请参阅 Fast Anime PromptGen 。我使用了非常类似的方法来训练Danbooru版本。
作者:
数据集大小:
780.73 MB