机器学习工业界和学术界的差别越来越大了吗?尽早实习和踏实科研各有什么利弊?
2019年01月25日 由 荟荟 发表
703657
0
体验有很多,个中心酸不足为外人道也。
记一次长驱直入的论文复现过程......
做科研和做实际工程,最大的区别在于:对!需!求!的!理解!不同!
工程领域是什么样的呢,举个例子。不知道有多少人写过工程项目申请书,一般来说逻辑是这个样子的。
“首长们要做这件事,这件事很重要,需要一个系统来辅助他,国外已经有很多成熟的系统了,我们要奋起直追(意义和国内外现状)。做这件事需要XXX,而XXX可以用A做,也可以用B做,也可以用关联规则做,其中关联规则用得最广,你看这个系统是用关联规则做的,那个系统也是用关联规则做的,所以我们也用关联规则(内容和可行性)。我们团队做关联规则很有实力,请给经费吧,我们一定会把项目做出来的(研究基础)。”
看到没?工程项目的需求是:“用最稳妥的方法,尽可能控制风险,辅助某人或某个团体完成另一件事”
而这两者的区别在实际操作中所体现出来的就是:你用写项目申请书的方法写论文绝对被拒稿。(别人都做过了你这个研究的创新点在哪里呢?没有意义阿)
同样,你用写论文的方法写项目申请书绝对一分钱拿不到。工业界基本遵循奥坎姆剃须刀原则,在不牺牲很大性能的情况下,更加愿意选择简单,稳定性强,可解释性强,可维护性好的算法与模型。本身根本不会像kaggle那样追求那么高精准的结果。
建议:搞科研的去干工程可以,搞工程的去干科研就算了,简直要了亲命。
原因就在于知识储备。当你浸淫于“找别人没玩过的去玩”很多年以后,你会发现,基本上这个世界上你所在领域的所有的玩法你都门清。哪些成熟、哪些有缺陷,哪些适合A,哪些适合B。
当然,事无绝对,在数据挖掘与机器学习领域,还是有很多三区四区期刊是以工程为导向的,虽然没有工程申请书那么那么的接地气,但要好很多。当然,这些期刊知乎大神们是不会看上的。
搞科研能让你逐渐扩充领域内的知识储备,如果以后搞工程也容易转行。搞工程能让你更熟悉甲方要什么,但是这项优势平心而论保持不了多久,且主要靠“基于人脉的垄断”来维持。
“落后的工业水平,跟不上科研产物”
大多数人们所谓的算法指的是学术研究上提出的理论,普遍的问题就是看起来很美好,落地很困难。研究成果商业化周期的滞后。学术界的研究成果,在能够商业化前还有很长的路要走。早在思必驰的一次采访中,周伟达的就与记者大吐过这样的苦水:“还有相当一部分的算法停留在实验室里。我们虽然在技术上做了验证,但没法在目前的硬件平台上落地。“周伟达举了这样的一个例子:“比如,在 2015 年时,我们提出多麦克风阵列设计,我们自己设计了代码,然后去跟芯片厂家提出芯片接口是否能增加六个、八个麦克风,因为当时的 SOC 芯片一般只有左右两个通道的麦克风。但芯片厂商的迟疑是「你们确认有这个需求吗?」这些需求或许在他们看来是不可思议的。最后我们没办法,直接去用 FPGA 这种可编辑的硬件器件自己搭了一个 demo,向客户演示是双麦还是六麦效果更好,如果六麦效果更好,那芯片是否应该支持。所以作为技术提供商我们去要去硬件平台非常费劲!”
文章转载自:https://www.zhihu.com/question/63883029/answer/227297046