2018年最实用的6个机器学习项目
2019年01月02日 由 浅浅 发表
207579
0
过去一年,机器学习在许多领域具有较大影响力,特别是在医疗保健,金融,语音识别,增强现实和更复杂的3D和视频应用中。
下面让我们来看看2018年最实用的6个ML项目。这些项目发布了代码和数据集,允许个别开发人员和小型团队学习并立即出创造价值。它们可能不是理论上最具开创性的,但它们十分实用。
Fast.ai
Fast.ai库的编写目的是,使用最佳实践简化对快速且准确神经网络的训练。它抽象了在实践中实现深层神经网络所需要的所有细节工作。它非常易于使用,并且是用实践者的应用程序构建思维来设计的。最初是为学习Fast.ai课程的学生创造的。文档也是一流的。
项目:
github.com/fastai/fastai/stargazers
文档:
docs.fast.ai/
Detectron
Detectron是Facebook AI用于物体检测和实例分割研究的研究平台,用Caffe2编写。它包含各种对象检测算法的实现,包括:
- Mask R-CNN:使用更快的R-CNN结构进行对象检测和实例分割
- RetinaNet:一个基于金字塔的网络,具有独特的Focal Loss来处理复杂例子
- Faster R-CNN:对象检测网络最常见的结构
所有网络都可以使用以下几种可选的分类主干之一:
- ResNeXt {50101152}
- RESNET {50101152}
- 功能金字塔网络(使用ResNet / ResNeXt)
- VGG16
更重要的是,所有这些都带有COCO数据集上的预训练模型,因此你可以立即使用它们!它们已经在Detectron模型动物园中使用标准评估指标进行了测试。
项目:
github.com/facebookresearch/Detectron
FastText
FastText库专为文本表征和分类而设计。它配备了预先训练的150多种语言的单词向量模型。这样的单词向量可以用于许多任务,包括文本分类,摘要和翻译。
项目:
github.com/facebookresearch/fastText
AutoKeras
Auto-Keras是用于自动机器学习(AutoML)的开源软件库。它由Texas A&M大学的DATA实验室和社区贡献者开发。AutoML的最终目标是为具有有限数据科学或机器学习背景的领域专家提供易于访问的深度学习工具。Auto-Keras提供自动搜索深度学习模型的最佳架构和超参数的功能。
项目:
github.com/jhfjhfj1/autokeras
Dopamine
Dopamine是由谷歌创建的强化学习算法快速原型设计的研究框架。它灵活且易于使用,实现标准RL算法,指标和基准。
根据Dopamine的文档,他们的设计原则是:
- 简单的实验:帮助新用户运行基准实验
- 灵活的开发:为新用户提供新的创新想法
- 紧凑和可靠:为一些较旧和更流行的算法提供实现
- 可重复性:确保结果是可重复的
项目:
github.com/google/dopamine
vid2vid
vid2vid项目是Nvidia最先进的视频到视频合成算法的公共Pytorch实现。视频到视频合成的目标是学习从输入源视频(例如,一系列语义分割掩模)到精确描绘源视频内容的输出照片拟真视频的映射函数。
这个库的优势在于它的选项:它提供了几种不同的vid2vid应用程序,包括自动驾驶/城市场景,人脸和人体姿势。它还附带了丰富的指令和功能,包括数据集加载,任务评估,训练功能和多GPU。
项目:
github.com/NVIDIA/vid2vid
其他重要项目
ChatterBot:用于对话引擎和创建聊天机器人的机器学习
Kubeflow:Kubernetes的机器学习工具包
imgaug:用于深度学习的图像增强
imbalanced-learn:scikit下的python包,专门用于修复不平衡数据集
mlflow:用于管理ML生命周期的开源平台,包括实验,可重复性和部署
AirSim:基于Unreal Engine/ Unity的自动驾驶汽车模拟器,来自Microsoft AI和Research