亚马逊Comprehend增加新功能,无需机器学习背景也能为应用添加NLP
2018年11月20日 由 浅浅 发表
822055
0
去年,亚马逊宣布推出一款自然语言处理工具Comprehend,帮助企业从信息集中提取常用词汇和短语。今天,在其Re:invent customer会议前的一周,亚马逊宣布了Comprehend性能的增强,允许开发人员在没有机器学习领域知识的情况下构建专业单词和短语列表。
新的无代码自定义工具,即Custom Entities和Custom Classification,在Comprehend中将允许开发人员识别自然语言术语并对专门针对其团队,业务或行业的文本进行分类,亚马逊网络服务公司学习与AI总经理Matt Wood博士写道。
他表示,“许多客户告诉我们他们拥有过剩的数据,特别是包含非结构化,自然语言的数据,在找到潜在信息的宝库之前,你可能不必深入自己的组织内部,机器学习十分擅长找到特别的东西。”
为此,Custom Entities允许客户教Comprehend特定于垂直位置或域的术语。通过一小部分示例,例如政策编号列表和使用它们的文本,Custom Entities可以训练一个能够识别任何给定片段中的目标文本的定制模型。
一个作为补充的新功能,即Custom Classification使开发人员能够将文档分组到命名类别。只需50个示例,Custom Classification就可以训练一个能够对电子邮件,社交媒体帖子,分析报告和其他文档进行分类的模型,或者根据其内容对其进行分类。
Custom Entities和Custom Classification现在都可用。Wood博士写道,LexisNexis已经使用Custom Entities功能从超过2亿份文档中提取法律实体,准确率超过92%。
Wood补充道,“自AWS创立以来,我们的目标一直是将传统上只有大型、资金充裕的组织才能获得的技术,交给所有开发人员使用。在底层,Comprehend将承担构建、训练和托管定制的机器学习模型的重任,并通过私有API使这些模型可用,这些新的特性正是这种精神的完美体现。”