英特尔开源用于自然语言处理的库,为会话智能体研究提供便利
2018年05月25日 由 浅浅 发表
971452
0
英特尔人工智能实验室已经开源了一个用于自然语言处理的库,帮助研究人员和开发人员为聊天机器人和虚拟助手等会话智能体提供运行所必需的功能,例如名称实体识别,内涵提取和语义分析,以从会话中识别人们想要做出的行动。
就在几个月前,英特尔人工智能实验室计划开源更多的库,以帮助开发人员训练和部署人工智能,发布研究成果,并重现AI研究团队成员的最新的创新技术,以推动AI和深入学习到域。
“我们希望回馈给开源社区,无论是作为初学者,还是工程师或研究人员,您都可以通过查看,再现,调查和验证内容,然后自用,”英特尔AI Lab实验室负责人数据科学部Yinyin Liu在英特尔AI DevCon的采访中表示。
英特尔人工智能实验室雇用了大约40位数据科学家和研究人员,并与该公司的部门合作开发像nGraph框架和Nervana神经网络芯片这样的硬件产品。
“在这一点上,我们已经制定了一套深度学习驱动的NLP模型。它并不是对于任何特定的应用程序或域,但是在英特尔,我们正在与合作伙伴和开发人员一起研究使用案例,并使用这些构建模块中的一部分,以便存入库中。”Liu说。
自从12月份推出模型以来,英特尔人工智能实验室也开放了源代码库来帮助人们部署强化学习和神经网络。
上个月发布的神经网络蒸馏器库被用来剥离与你的任务无关的神经连接。Coach强化学习库允许用户在机器人或自驾车模拟器等训练环境中嵌入智能体。
NLP库nlp-architect包括使用数据集制作工具,这些数据集通常被学术研究团体成员视为基准,例如用于测试机器阅读理解的斯坦福问题应答数据集(SQuAD)。它还可以使用定制数据或公共基准数据集与Google的TensorFlow或Facebook的PyTorch等流行的开源框架一起训练模型。
“我们允许开发人员下载公共基准数据集并训练使用深度学习架构创建的网络,然后他们可以自行开展训练,在NLP架构师训练之后,您可以将模型保存到某些模型文件中,然后你可以使用它来对你的应用程序进行推断,”Liu说。