关键术语总结:117个数据科学关键术语的解释
2017年09月11日 由 xiaoshan.xiang 发表
425657
0
这篇文章展示了一组数据科学相关的关键术语,这些关键术语简明而实用,由12个不同的主题组成。
20个大数据的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/08/big-data-key-terms-explained.html
大数据。它至少在十多年前就开始成为流行术语了。
但是,仅仅听说过这个术语,或者已经接受了(或反对)它的简单用法,并不意味着人们知道它到底意味着什么,或者它包含了什么。实际上,试图在一篇文章中详尽地描述大数据是没有意义的。但是收集与大数据相关的一些关键术语是一件很好的事,因为它为今后的工作打下了基础
12个机器学习的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/05/machine-learning-key-terms-explained.html
这篇文章将提供相关术语的简明解释(在本例中是机器学习),特别为那些寻求隔离和定义的人提供一种简单的方法。经过一段时间的思考后,我们发现这些基础知识教育的帖子在过去并没有得到足够的曝光。
那么,让我们从机器学习和相关话题开始。
10个集群的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/10/clustering-key-terms-explained.html
集群是一种数据分析的方法,它将数据集中在一起,用来“最大化组内相似性和最小化组内相似性”,而不使用预先定义的点标签(即:一种无监督的学习技巧)。本文介绍了在集群分析中常用技术的关键术语。
14个深度学习的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/10/deep-learning-key-terms-explained.html
深度学习是一个相对较新的术语,尽管它早在最近的线上搜索急剧上升之前就已经存在了。由于在许多不同领域取得了令人难以置信的成功,研究和工业的迅猛发展,深度学习是应用深度神经网络技术的过程——也就是有多种隐藏层的神经网络架构——来解决问题。深度学习是一个过程,就像数据挖掘一样,它采用了深度神经网络体系架构,该架构是一种特定的机器学习算法。
16个数据库的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/07/database-key-terms-explained.html
数据需要经过精心策划、呵护和照顾。它需要被存储和处理,这样它就可以转化为信息,并进一步细化为知识。存储数据的机制为这些转换提供了便利。
本文介绍了16个关键的数据库概念及其对应的定义。
15个描述统计学的关键术语的解释
链接地址为http://www.kdnuggets.com/2017/05/descriptive-statistics-key-terms-explained.html
统计数据虽然是数据科学的一组核心工具,但却常常被忽视,因为它们更倾向于编程等技术技能。甚至机器学习的算法也依赖于数学概念,如代数和微积分——更不用说统计学了。
11个预测分析入门的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/07/siegel-predictive-analytics-key-terms-explained.html
本文编辑了所有的关键定义,包括了PAW创始人Eric Siegel的受欢迎的获奖书籍:“预测分析:预测谁会点击,购买,说谎,或死亡(修订和更新,2016)”(链接地址为http://www.thepredictionbook.com/),在35所大学里,它被作为教科书使用,但读起来像流行科学,被称为“大数据的魔鬼经济学”。
20个云计算的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/06/cloud-computing-key-terms-explained.html
云计算主要使企业能够更快地部署应用程序,而不需要过度维护,这是由服务提供商管理的。这还可以根据业务的需求和需求,更好地利用计算资源。
尽管互联网上充斥着与云相关的术语,但这里有一些非常基本的却重要的内容,那就是我们应该对它们有一定的了解。了解这些关键术语将有助于你了解云计算的行业发展和未来趋势。
16个Hadoop的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/05/hadoop-key-terms-explained.html
Hadoop是Apache Foundation管理的一个非常强大的开放源码平台。Hadoop平台是基于Java技术构建的,能够在分布式集群环境中处理大量异构数据。它的扩展能力使它非常适合分布式计算。
Hadoop生态系统由Hadoop核心组件和其他相关工具组成。在核心组件中,Hadoop分布式文件系统(HDFS)和MapReduce编程模型是两个最重要的概念。在相关的工具中,用于SQL的Hive、用于dataflow的Pig、管理服务的Zookeeper等都很重要。我们将详细解释这些条款。
13个Apache Spark的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/06/spark-key-terms-explained.html
Apache Spark之所以如此受欢迎,其中一个原因是Spark为数据工程师和数据科学家提供了一个强大的、统一的引擎,其速度快(比Apache Hadoop快100倍,用于大规模数据处理),且易于使用。这使得数据从业者能够以更大的规模来解决他们的机器学习、图谱计算、流式传输和实时交互查询的问题。
在这篇博客文章中,我们将讨论在与Apache Spark合作时遇到的一些关键术语。
12个物联网的关键术语的解释
链接地址为http://www.kdnuggets.com/2016/07/internet-of-things-key-terms-explained.html
物联网(lot)是一种概念,允许基于物理对象、传感器和控制器之间的互联网通信。这篇文章以简单明了的方式解释了物联网的12个关键术语。
18个自然语言处理的关键术语的解释
链接地址为http://www.kdnuggets.com/2017/02/natural-language-processing-key-terms-explained.html
这篇文章用一种实际的方法来定义一些关键的NLP术语。虽然你在阅读本文后肯定不会成为语言学专家,但我们希望你能更好地理解与NLP相关的一些术语,并继续在本文中学习更多关于NLP的内容。