Talla:关于人工智能中的NLP的一切
2019年07月02日 由 Aaron 发表
748640
0
自然语言处理(NLP)是人工智能的一个令人兴奋的子领域。在播客AI at work的第40集中,Basis Technology的首席运营官兼联合创始人Steve Cohen与Talla的首席执行官兼联合创始人Rob May一起,深入探讨了NLP的最新趋势和未来的可能性。
什么是NLP?Steve将其定义为人工智能的广泛领域所包含的功能之一,专注于弥合人类语言和计算机处理之间的差距。
在过去20年中,NLP发生了巨大变化。在AI工具,机器学习和统计建模出现之前,该方法是经典的、基于规则的NLP。这涉及雇用语言学家并让他们构建描述单词之间关系的数据和规则的字典,构建复杂的基于规则的体系结构。
这种方法几乎完全消失了,取而代之的是另一种基于规则的NLP。现在,机器弄清楚规则应该是什么。从本质上讲,机器学习已经取代了之前手动构建基于规则的NLP基础架构的语言学家。
实用的NLP应用程序
大多数人想到的第一个应用程序可能是机器翻译。Steve分享了NLP的其他几个有用的应用程序,包括能够识别文本的语言(对下游处理非常有用)和提取,即命名的实体提取。
他解释说,命名实体提取是公司有兴趣从文本中寻找姓名的东西,通常是人,组织,地点,公司等。此外,提取或识别也可能与产品,事件,关系等等有关。在理解客户的兴趣或对特定产品或特定品牌兴趣方面,情感分析尤其有用。
多年来,NLP一直是国家安全工作的重要组成部分。2006年,一场恐怖主义阴谋企图摧毁7架飞机,当时这7架飞机正载着走私的液体炸弹飞越大西洋。通过使用自然语言处理来分析截获的信息,美国和英国当局发现了阴谋,最终阻止了可怕的事件。多亏了NLP,这七架飞机上的人得救了,这也是为什么我们不能携带超过3盎司的东西上飞机。事实上,正是Steve的公司开发了威胁检测应用程序来揭露这个阴谋。
NLP的未来
NLP领域是否融合了一种可以用于许多不同事物的技术?并非如此。不同的NLP应用需要不同的方法,从MEMMS到神经网络,但是没有可以解决所有问题的灵丹妙药,这取决于手头的具体任务。
他们在近20年来一直遇到一个持久的上游问题,其中很大一部分是处理扫描的文档或PDF。Steve说,PDF文档的结构“旨在使打印变得容易。它的设计不是为了让人们很容易理解内部发生的事情,对结构进行逆向工程,扫描文档分割等等。
播客的最后一部分与哲学维度有关:人工智能的伦理,模型中的偏见,杀手机器人。
对于NLP和人工智能领域来说,还有更多的东西等待人们去挖掘。