2018年7月机器学习开源项目TOP 10
2018年07月27日 由 浅浅 发表
352862
0
在过去的一个月里,Mybridge AI根据各种因素对项目进行排名,在将近250个机器学习开源项目中选出前10位。
这个月10个项目在Github上平均评星为1041。
主题包括:DensePose,图像分类,多尺度训练,移动AI计算引擎,卫星图像,NLP,Python包,字检测,NCRF,DALI。
开源项目对程序员很实用,希望你找到一个启发你的有趣项目。
No.1:DensePose
这是一种实时方法,用于将2D RGB图像的所有人类像素映射到身体的3D表面模型。DensePose-RCNN在Detectron框架中实现,由Caffe2提供支持。
Github 2901颗星。由Facebook Research提供。
项目:github.com/facebookresearch/DensePose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.2:Darts
可分辨的架构搜索卷积和循环网络。该算法基于架构空间中的连续松弛和梯度下降。它能够有效地设计用于图像分类的高性能卷积体系结构(在CIFAR-10和ImageNet上)和用于语言建模的循环体系结构(在Penn Treebank和WikiText-2上)。只需要一个GPU。
Github 1128颗星。由Hanxiao Liu提供。
项目:github.com/quark0/darts?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.3:SNIPER,高效的多规模训练
SNIPER是一种有效的多尺度物体检测算法,用于实例级识别任务,如对象检测和实例级分割。SNIPER不是处理图像金字塔中的所有像素,而是选择性地处理地面实况对象(也称为芯片)周围的上下文区域。由于它在低分辨率芯片上运行,因此显着加速了多规模培训。由于其内存高效设计,SNIPER可以在训练期间受益于批量标准化,并且可以在单个GPU上实现更大批量大小的实例级识别任务。因此,我们不需要跨GPU同步批量标准化统计数据,我们可以训练对象检测器,类似于我们进行图像分类的方式!
Github 1352颗星。由Mahyar Najibi提供。
项目:github.com/mahyarnajibi/SNIPER?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.4:Mace
针对移动异构计算平台优化的深度学习推理框架。该设计侧重于以下目标:
- 性能
- 使用NEON,OpenCL和Hexagon优化运行时,并 引入Winograd算法以加速卷积运算。初始化也被优化为更快。
- 能量消耗
- 与芯片相关的电源选项如big.LITTLE调度,Adreno GPU提示作为高级API包含在内。
- 响应
- 在运行模型时,UI响应性保证有时是强制性的。引入了将OpenCL内核自动分解为小单元的机制,以便更好地抢占UI呈现任务。
- 内存使用和库占用空间
- 支持图级存储器分配优化和缓冲器重用。核心库试图保持最小的外部依赖性以保持库占用空间小。
- 模型保护
- 自设计开始以来,模型保护一直是最优先考虑的事项。引入了各种技术,例如将模型转换为C ++代码和文字混淆。
- 平台覆盖
- 良好的覆盖最近的高通,联发科技,Pinecone和其他基于ARM的芯片。CPU运行时还与大多数POSIX系统和性能有限的体系结构兼容。
Github 2118颗星。由小米提供。
项目:github.com/XiaoMi/mace?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.5:Robosat
航空和卫星图像的语义分割。提取功能,如:建筑物,停车场,道路,水。RoboSat附带的工具可分为以下几类:
数据准备:为训练特征提取模型创建数据集
训练和建模:图像特征提取的分割模型
后处理:将分割结果转换为干净和简单的几何形状
Github 776颗星。由Mapbox提供。
项目:github.com/mapbox/robosat?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.6:DecaNLP
自然语言十项全能是一项多任务挑战,涵盖十项任务:问答,机器翻译,摘要,自然语言推理,情感分析,语义角色标记,零镜头关系提取,目标导向对话,语义分析和常识代词解析。每个任务都被转换为问题回答,这使得我们可以使用新的多任务问题应答网络(MQAN)。此模型联合学习decaNLP中的所有任务,而多任务设置中没有任何特定于任务的模块或参数。
Github 886颗星。由Salesforce提供。
项目:github.com/salesforce/decaNLP?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.7:Magnitude
Magnitude是一个快速,简单的矢量嵌入实用程序库,用于在Plasticity开发的快速,高效和简单的方式中将矢量嵌入用于机器学习模型。它主要是为Gensim提供更简单/更快速的替代方案,但可以用作NLP之外的域的通用密钥向量存储。
Github 427颗星。
项目:github.com/plasticityai/magnitude?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.8:Porcupine
由深度学习驱动的设备唤醒字检测引擎。
- 自助服务。开发人员有权在几秒钟内选择任何唤醒词并构建其模型。
- 使用在真实情况下训练的深度神经网络(即噪声和混响)。
- 紧凑且计算效率高,使其适用于物联网应用。
- 跨平台。它以纯定点ANSI C实现。目前支持Raspberry Pi,Android,iOS,watchOS,Linux, Mac和Windows。
- 可扩展性。它可以同时检测数十个唤醒字,几乎没有额外的CPU /内存占用。
- 开源。您在此存储库中找到的任何内容都是Apache 2.0许可的。
Github 373颗星。由Picovoice提供。
项目:github.com/Picovoice/Porcupine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.9:NCRF
用神经条件随机场(NCRF)检测癌症转移。
Github 290颗星。由百度深度学习研究院提供。
项目:github.com/baidu-research/NCRF?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
No.10:DALI
DALI是高度优化的构建块和执行引擎的集合,用于加速深度学习应用程序的输入数据预处理。DALI提供加速不同数据流水线的性能和灵活性,作为单个库,可以轻松集成到不同的深度学习培训和推理应用程序中。
Github 420颗星。由NVIDIA提供。
项目:github.com/NVIDIA/dali?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more