英特尔开源数据标记工具包CVAT
2019年03月06日 由 bie管我叫啥 发表
704667
0
训练深度神经网络需要大量数据。并且根据现有的AI架构,如果没有标记,那么这些数据就没有多大用处,这需要花费很多时间,特别是处理包含数十万个对象的语料库时。
为了减轻数据注释器和数据科学家的负担,英特尔发布了一个新的开源程序,计算机视觉注释工具(CVAT),旨在加快用于训练计算机视觉算法的视频和图像样本的注释。
“为了加速计算机视觉领域的这一过程,我们开发了一个名为CVAT的程序,”英特尔在一篇博文中写道,“通常,有很多方法可以注释数据,但使用特殊工具可能有助于加快这一过程。”
正如公司所解释的那样,CVAT通过Docker进行部署,并通过基于浏览器的界面(或者可选地嵌入到Onepanel等平台中)进行访问,并具有针对协同工作优化的基于任务的管理系统。它支持与对象检测,图像分类和图像分割有关的监督机器学习任务,以及具有四种形状类型的注释:框,多边形,折线和点。
在CVAT中,注释器可以使用大量工具来复制和传播对象,应用过滤器,调整视觉设置,通过谷歌的TensorFlow框架中的对象检测API执行自动注释等等。CVAT会自动执行一些检查,它可以与英特尔的OpenVino,Nvidia的Cuda和ELK(Elasticsearch,Logstash和Kibana)分析系统等工具包很好地配合使用。
然而,CVAT需要逐渐改进。英特尔表示,它只在Chrome上进行了广泛的测试,并称Chrome的沙盒功能限制了进程周围的环境,包括RAM的使用对工具包的性能产生了负面影响。但是它承诺随着时间的推移会改善。
公司表示,“CVAT是为专业注释和算法团队开发的,并得到了这些团队的支持。我们努力提供这些团队从用户那里获得的最有价值反馈的功能,这将帮助英特尔确定CVAT未来的发展方向。我们希望改进该工具的用户体验、特性集、稳定性、自动化特性以及与其他服务集成的能力,并鼓励社区成员积极参与CVAT的开发。”
开源:
github.com/opencv/cvat