2018年12月机器学习Github开源项目TOP 10
2019年01月11日 由 浅浅 发表
933071
0
在过去的一个月里,我们将250个机器学习开源项目进行排名,选出前10位。
在此期间,我们将项目与新的或主要版本进行了比较。Mybridge AI根据各种因素对项目进行排名,以衡量专业人员的质量。
这个版本所有项目在Github上的平均评星:1113
1.Pytext
PyText是在PyTorch上构建的基于深度学习的NLP建模框架。PyText解决了实现快速实验和大规模服务模型之间的冲突。它通过为模型组件提供简单且可扩展的接口,使用PyTorch通过优化的Caffe2执行引擎导出模型进行推理的功能来实现。由Facebook Research提供。
Github评星2344。
项目:github.com/facebookresearch/pytext
2.Jax
JAX是Autograd和 XLA汇集在一起,进行高性能的机器学习研究。新的是JAX使用 XLA 在GPU和TPU上编译和运行NumPy程序。默认情况下,编译发生在底层,库调用是实时编译和执行的。
但是JAX还允许使用一个函数API jit,将你自己的Python函数及时编译成经过xla优化的内核。编译和自动微分可以任意组合,因此你可以在不离开Python的情况下表达复杂的算法并获得最大的性能。JAX实际上是一个可扩展的可组合函数转换系统。由谷歌提供。
Github评星2352。
项目:github.com/google/jax
3.Reaver-pysc2
Reaver是一个深度强化学习智能体,专为训练各种基于星际争霸II的任务。Reaver的重点是追随DeepMind的脚步,通过播放有类人界面与模仿的现代视频游戏的镜头推动该领域的最新技术。这包括观察与人类玩家所感知的类似(不完全相同)的视觉特征,并从人类玩家所具有的类似选项中选择行动。由Roman Ring提供。
Github评星310。
项目:github.com/inoryy/reaver-pysc2
4.PySyft
PySyft是用于安全,私密的深度学习的Python库。PySyft使用PyTorch中的多方计算(MPC)将私有数据与模型训练分离。由OpenMined提供。
Github评星2444。
项目:github.com/OpenMined/PySyft
5.Image-super-resolution
该项目的目标是升级低分辨率图像,为实现这一目标,使用Residual Dense Network中描述的CNN Residual Dense Network实现图像超分辨率。团队编写了一个Keras网络实现,并设置了一个Docker镜像来进行训练和测试。你可以使用AWS和nvidia-docker在本地或云上进行训练,只需几个命令。
Github评星222。
项目:github.com/idealo/image-super-resolution
6.Bert-as-service
BERT是由谷歌开发的用于预训练语言表示的NLP模型。它利用网上公开提供的大量纯文本数据,并以无人监督的方式进行训练。预训练BERT模型对于每种语言来说都相当昂贵且是一次性的过程。幸运的是,谷歌发布了几个预先训练好的模型。
bert-as-service使用BERT作为句子编码器并通过ZeroMQ将其作为服务托管,只用两行代码就可将句子映射到固定长度的表征。由Han Xiao提供。
Github评星1147。
项目:github.com/hanxiao/bert-as-service
7.Transparent_latent_gan
该项目提供了一种新方法来控制无监督训练的生成模型(如GAN)的生成过程。GAN可以从潜在空间中的随机噪声向量生成随机逼真的图像,但是我们无法控制生成的图像的特征。而知道了图像是由潜在空间中的噪声矢量决定的,如果我们能够理解潜在的空间,我们就可以控制我们的生成过程。由SummitKwan提供。
此方法优于有条件的GAN和AC-GAN的优点:
效率:要添加发电机的新控制器,不必重新训练GAN模型,因此只需要不到1小时就可以添加40个knob。
灵活性:可以使用在不同数据集上训练的不同特征提取器,并为训练有素的GAN添加knob。
Github评星1246。
项目:github.com/SummitKwan/transparent_latent_gan
8.Self_driving_pi_car
Self-Driving Pi Car是一款基于深度神经网络的自动驾驶汽车,它将Lego Mindstorms NXT与Raspberry Pi 3的计算能力结合在一起。由Felipe Salvatore提供。
Github评星654。
项目:github.com/felipessalvatore/self_driving_pi_car
9.Gandissect
Gandissect是一种检查GAN的内部表征的方法,以理解内部单元如何与人类可解释的概念一致。它是NetDissect的一部分。由MIT COMPUTER ViSiON提供。
Github评星804。
项目:github.com/CSAILVision/gandissect
10.Aleph_star
它是A *式的算法(成本最小化算法)但使用可学习的启发式算法。在图上找到两个节点之间的最小成本路径的问题可以被表述为决策过程,其中在每个被访问节点处必须采取最优化的动作来最小化总累积成本。通过奖励取代成本,任何产生成本最小化动作的算法都会产生奖励最大化动作,从而成为马尔可夫决策过程(MDP)的候选求解器。
Github评星134。
项目:github.com/imagry/aleph_star