Gamalon发明并商业化革命性的机器学习技术
2017年02月23日 由 荟荟 发表
334452
0
新创业公司Gamalon,Inc。的创始人兼首席执行官Ben Vigoda创造了一种技术,该技术使模型编写过程自动化,将技术从数据科学家的工具转变为从数据中学习的全面机器学习技术, 通过它自己。
Bernadette Esposito
Andrew Ng是Google Brain的祖先之一,也是近年来神经网络复兴的倡导者,他在TED演讲中讲述了他的起源故事。他说,他试图通过编程直升机的数学模型来制作一架自动驾驶直升机,但无论他如何努力研究他的空气动力学和直升机力学的数学模型,他都无法让直升机飞行。然后,他决定只依靠直升机传感器的数据来训练机器学习算法,直升机飞得非常好。Ng说他从这次经历中学到了不尝试自己编写复杂的模型,而是依靠深度学习算法。
位于马萨诸塞州剑桥市的新创业公司Gamalon,Inc。的创始人兼首席执行官Ben Vigoda与Andrew Ng的形成经历几乎相同,但他得出了完全不同的结论。在他之前的麻省理工学院机器学习芯片创业公司Lyric Semiconductor,Inc。后来被ADI公司收购,花了很长时间和大量资金来开发用于信号处理应用的工作数学模型。但是Vigoda决定不放弃编写数学模型。相反,他认为所需要的是用于开发和调试数学模型并使其更快地适应数据的工具。Vigoda说,“编写这些模型,使它们适合数据,看错了什么,然后改进模型是缓慢而艰巨的。尝试改进模型的想法可能需要数周时间,通常需要数年时间才能进入工作系统。对于常规编程,我们有编译器,调试器,分析器等所有这些技术,可以很容易地快速编写和改进您正在编写的程序。此开发环境支持敏捷编程。但对于数学(贝叶斯)模型 - 科学家为了适应他们的数据而编写的那种模型,我们没有任何类似的开发工具。“Vigoda创建了Gamalon,并在DARPA的资助下,开始构建这些工具。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。我们有编译器,调试器,分析器等所有这些技术,可以很容易地快速编写和改进您正在编写的程序。此开发环境支持敏捷编程。但对于数学(贝叶斯)模型 - 科学家为了适应他们的数据而编写的模型,我们没有任何类似的开发工具。“Vigoda创建了Gamalon,并在DARPA的资助下,开始构建这些工具。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。我们有编译器,调试器,分析器等所有这些技术,可以很容易地快速编写和改进您正在编写的程序。此开发环境支持敏捷编程。但对于数学(贝叶斯)模型 - 科学家为了适应他们的数据而编写的那种模型,我们没有任何类似的开发工具。“Vigoda创建了Gamalon,并在DARPA的资助下,开始构建这些工具。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。此开发环境支持敏捷编程。但对于数学(贝叶斯)模型 - 科学家为了适应他们的数据而编写的那种模型,我们没有任何类似的开发工具。“Vigoda创建了Gamalon,并在DARPA的资助下,开始构建这些工具。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。此开发环境支持敏捷编程。但对于数学(贝叶斯)模型 - 科学家为了适应他们的数据而编写的那种模型,我们没有任何类似的开发工具。“Vigoda创建了Gamalon,并在DARPA的资助下,开始构建这些工具。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。“第一个结果是我们能够更快地构建和测试模型。我们可以编写科学(贝叶斯)模型并几乎立即对数据进行测试,看看哪些模型和模型的哪些部分有助于最有效地解释数据。
但那只是一个开始。当他们意识到他们可以开始取代人类建模者时,真正的“啊哈”时刻到来了。“我们发现,我们为人类构建的开发工具实际上可以用来指导计算机对模型进行自己的更改,并自主测试这些新模型。通过自动化模型编写过程,我们将技术从数据科学家的工具转变为一种完全成熟的机器学习技术,该技术可以从数据中学习。该系统已经在传统的机器学习任务上表现得非常好,如图像识别和自然语言处理。“Gamalon将这项新发明称为贝叶斯程序综合(BPS),它的表现与深度学习完全不同。该公司有一个演示视频,系统学习识别绘图与Google DeepMind中名为“Quick,Draw!”的绘图识别应用程序并排比较。Gamalon的BPS系统仅从一些培训示例中学习,而不是数千或数百万,来自一个人而不是数千人,在iPad上而不是在数百台服务器上运行,并且几乎立即学习而不是花费数天,数周或数月来完成学习计算。这些性能改进有望使机器学习社区受到关注。并且几乎立即学习,而不是花费数天,数周或数月来完成其学习计算。这些性能改进有望使机器学习社区受到关注。并且几乎立即学习,而不是花费数天,数周或数月来完成其学习计算。这些性能改进有望使机器学习社区受到关注。
Gamalon现在宣布使用他们的BPS技术,Gamalon Structure和Gamalon Match创建的前两个商业应用程序。“这是机器学习即服务,”他解释说。“我们可以在任何主要的云提供商上托管它。”
公司可以使用该服务来构建,清理,准备和集成来自不同来源的数据。Vigoda说:“超过90%的企业数据无法使用,因为它是非结构化的。公司拥有大量的自由形式文本,例如产品描述,客户姓名和地址,已转换为文本的语音查询,保险索赔说明,医生笔记等。他们需要将每个文本块转换为具有右列的数据库行。现在没有一个好方法可以做到这一点,所以公司外包给机械土耳其人或专业服务公司,他们会遇到很多错误。我们的新产品Gamalon Structure解决了这个数据结构问题。“
此外,如果要将多个数据源链接和集成在一起,则需要使用数据集成或数据准备软件,“Vigoda解释说。“然后,您支付的费用是您支付软件费用的十倍,以便审核结果并消除错误和冗余。整合需要数月,然后你可以让几十人审查结果。“Gamalon Match解决了这个数据集成问题。
一位Gamalon客户在美国拥有数百家实体店,并希望使用Gamalon为家庭配送服务建立库存系统。“他们需要链接到他们的商店并找出货架上的产品,”Vigoda说。这可能听起来很简单,直到你考虑“有多少不同的方式描述饮食可乐的情况,”Vigoda补充道。“我们的系统进入所有数据库,读取所有数据库,并确定每个商店中可用的数据,因此当驱动程序到达商店时,他们知道产品将等待。”
与此同时,一家制造和批发商客户“想知道其数百家经销商和他们销售的产品是什么,”Vigoda说。“因此,我们进入并连接所有这些数据库,将它们与合同列表对齐,并获得产品如何通过其分销渠道的令人难以置信的观点。”
Gamalon最终的目标是为所有SaaS软件提供“无处不在的中间件层”,Vigoda说。“今天,有数百种不同的企业SaaS应用程序可用,每种应用程序都以不同的方式存储数据,每家公司都购买不同的组合。我们可以提供单一的全局视图,了解您公司的销售情况和销售对象,库存来源以及您为此支付的费用,无需迁移到单个集中式数据库系统。我们可以用记录企业信息索引的机器智能替换记录的数据库系统。我们很高兴看到这些首批产品带我们去哪里!“
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com