Cloudera宣布更新一系列机器学习产品,为数据团队提速
2018年05月22日 由 浅浅 发表
59960
0
软件公司Cloudera今天在Strata Data伦敦会议上宣布了一系列机器学习产品更新:Cloudera Data Science Workbench 1.4,Microsoft Azure Cloudera Altus数据工程和Cloudera Enterprise 6.0。首席执行官Tom Reilly表示,这三种产品主要负责促进数据团队之间的协作。
“我们相信通过数据可以实现今天看似不可能的事情。凭借机器学习,分析和云中的增强功能,我们宣布的新软件产品和云服务将使我们的客户能够更快地在数据经济中获得竞争优势。”Reilly在一份声明中表示。“这些增强功能展示了Cloudera对市场领先创新的承诺,这些创新使企业能够将复杂数据安全地转化为清晰可行的方法,从而推动其数字化转型。”
Azure上的Cloudera Altus数据工程昨天上线,支持Apache Spark,Apache Hive,Spark上的Hive以及MapReduce 2。Cloud Enterprise 6.0和Altus Analytic DB今天公测,而Data Science Workbench 1.4预计将在今年夏天推出。
Data Science Workbench允许数据科学团队在单一平台上构建,运行,训练,比较和实施机器学习模型。版本1.4提供了用于运行和跟踪实验的工具包,并允许用户将模型部署为网络应用的表述性状态传递(REST)API的一键式工具。
Cloudera Atlas将以云为中心,Cloudera声称这是第一个“多云,多功能”的服务平台。其旗下产品包括用于Azure的数据工程,它授予处理作业对Microsoft Azure Data Lake Store(ADLS)的读写访问权限,以及Altus Analytic DB,这是一种数据库服务,可在SQL,Python,R以及Altus SDX的其他格式中提供数据库分析。这是对Cloudera Altus软件开发工具包(SDK)的补充,它允许对Java进行编程访问,以及自动工作负载性能监视器,用以标记潜在的问题。
最后一项要点是Cloudera Enterprise,一个用于机器学习和分析应用程序的平台。与前一版本相比,最新版本(版本6.0)引入了GPU支持和Apache Hive数据库优化,可显著加速机器学习和数据工程应用程序,并提供Apache Solr 7.0(支持嵌套数据类型和JSON构面),Kafka 1.0和Spark 2.2作为本地组件。Cloudera声称,即使在单个Cloudera Manager 6.0接口集群中有多达2,500个节点,平台上的机器学习速度也有可能提高10倍。利用Apache Hive 2.0的分析工作负载可以提高多达80%的性能。
总经理Hilary Mason在Cloudera机器学习一份声明中说,“我们很高兴能够在Cloudera Data Science Workbench中发布新功能,加速数据科学家的日常工作流程,包括实验管理和模型部署,同时保持数据安全和管理的无缝体验。”