DataRobot:AutoML是解决数据科学技能短缺的答案吗?
2019年05月15日 由 三分之一光年 发表
158081
0
虽然AutoML可能不会将小白转变为大师,但它确实降低了进入更多企业的障碍,以获得数据时代的好处。
行业中重要的数据科学工作没有被填补。几乎美国没一个城市都存在着技能短缺的问题,像LinkedIn这样的在线招聘网站在过去的一年里都在报道。
也不是因为缺乏申请人。入门级的数据科学工作吸引了几十个,甚至数百个申请人。“数据科学领域存在经验不足,”就业委员会Glassdoor的高级经济学家Daniel Zhao解释说。“有很多最近毕业的毕业生可以在一个数据集上扔下一大堆模型,但缺乏经验丰富且合格的、完全结合了技术技能、业务专业知识和领域知识工人。”
AutoML提供了一种解决方法。据DataRobot赞助的白皮书中的IT专家Tom Davenport说:“众所周知,高级技能的短缺,而且由于AutoML在机器学习方面做了很多基于专业知识的任务,它可以帮助缓解技能短缺。”
巴布森学院(Babson College)的信息技术和管理杰出教授Davenport说,AutoML代表着“向该领域民主化迈出的重要一步”。
“是的,它可以缓解数据科学技能的短缺,”Booz Allen Hamilton的首席数据科学家和执行顾问Kirk Borne说。
但是,AutoML真的能达到炒作的程度吗?让数据科学专家从新手中脱颖而出?两位德国研究人员最近写了一篇论文(关于自动机器学习的调查),在论文中,他们提及AutoML可以通过使领域专家在不了解统计学和机器学习的情况下自动构建预测模型来减少对数据科学家的需求。
斯图加特大学教授Marco F. Huber说,是的,总有一天会发生。但他和合著者Marc Andr_z_ller正在寻找成熟的AutoML,涵盖了从数据选择到模型测试的整个范围,在他们看来,完整的AutoML“还没有形成”。
顾问Alexis Perrier说:“这是一种帮助,但不是解决技能短缺问题的办法。”数据清理仍然占数据科学家工作的80%,而AutoML并没有真正解决这个问题。“这不是一个神奇的解决方案。这是体系的一部分,另一个要使用的工具。”
Huber说,AutoML最令人兴奋的可能性是它能为领域专家做些什么。“将领域专家转变为数据科学家比将数据科学家转变为领域专家更容易。”Huber补充说,数据科学家可能对算法选择、特征工程和降维有一定的了解,但将特定的主题知识转化为数据科学家的头脑可能非常困难。“这是没有工具的。”