为什么数据污染对LLM来说是一个大问题
康奈尔大学推出新的社交机器人,更柔软,更人性化
所以,能动手就别吵吵了
字节跳动旗下团队推出的免费AI英语写作助手
StabilityAI推出的文本到图像生成AI
GitHub AI编程工具
Adobe最新推出的AI图片生成工具
AI艺术和创意辅助平台
数据集:
katanaml-org/invoices-donut-data-v1
任务:
语言:
大小:
许可:
该数据集包含500个发票文档,已进行注释和处理,以便进行Donut ML模型的微调。
注释和数据准备任务由 Katana ML 团队完成。
Sparrow - Katana ML的开源数据提取解决方案。
原始数据集 info : Kozłowski, Marek; Weichbroth, Paweł(2021),“电子发票样本”,Mendeley Data,V2,doi:10.17632/tnj49gpmtz.2
作者:
数据集大小:
188.37 MB