ClaraLabs的机器学习
2016年07月05日 由 荟荟 发表
300718
0
克拉拉实验室 正在建立一个结合了最好的人力和机器人才的同事。像机器一样,克拉拉总是记得偏好。像一位优秀的助手一样,Clara非常重视每条消息的细微差别,并有助于建立作为团队成员的丰富关系。为了实现这种自动化但社会娴熟的体验,人员和机器工作并一起学习,以在我们认为是合作智能的积极反馈循环中完成任务。
我们的平台使Clara远程助理(CRA)成为超人类:他们可以处理来自数百名客户的复杂请求,而每个客户或对话几乎没有任何先验背景。相反,传统的远程助理可以处理最多三到五个客户端。通过机器学习(ML)进一步放大比例,用于部分(有时完全)自动化工作。
实时人在环系统缩短了新ML驱动功能的上市时间。
构建实时人在环系统可缩短新ML驱动功能的上市时间,并对预测如何集成到平台中产生重大影响。我们很乐意分享我们对这些问题的看法。
克拉拉的机器学习
首先,一点背景。监督ML算法需要带注释的训练数据。在最基本的设置中,每个数据点采用形式(例如,注释); 例如,我们可能有一对(“我正在复制我的助手来设置一些东西。”,REQUEST_SCHEDULE)。构建一个好的数据集有两个关键方面:
1.示例应与我们在应用程序中预期的类似。如上例所示,安排请求很难找到维基百科短语或新闻文章的语料库。
2.必须为目标应用程序精确注释每个示例。
训练样例越具代表性,注释越好,预测结果就越好。获得这样的注释数据可能是困难且耗时的,因为通常需要数万个独特的例子。在实践中,原始数据示例被执行到执行繁琐注释任务的承包商; 疲劳经常导致许多注释错误和噪声数据。
我们的平台在以下方面脱颖而出。
我们为人和机器共同设计
调度任务被分解为可由人和机器理解的子任务,紧密耦合软件设计和人工过程。仔细考虑必须注释的内容通常会增加易处理性预测模型。
我们的数据质量很高,因为注释者“得到它”
CRA通常隐含地扮演注释者的双重角色。因此,我们的助手在执行Clara任务时表现越好,我们的训练数据质量就越高。此外,数据质量是跨学科(如UX)和公司团队的首要考虑因素。
小数据集很快成为大数据集
人工监督意味着预测一开始不需要高度准确,能够快速启动新的学习驱动的产品功能。我们快速测试新想法,而无需花费大量资源来构建数据集和调优算法。换句话说,我们的机器学习工作非常灵活。
敏捷ML:一个简单的例子
并非我们所有的ML功能都开始纯粹用于自动化。这方面的一个例子就是我们对助手的同情提示。
黑色水平线上方的文本是发送给Clara的示例消息。带下划线的黄色短语按我们的算法分类为“疾病”和第一人称。基于这些参数生成黑色水平线以下的建议响应。
如图所示,我们检测到移情反应何时适合,生成建议并将其呈现给助理。CRA可以选择轻松地在传出消息上添加响应。选择后,这将作为我们数据集的注释,并带来更好的客户体验。我们可以在准确到足以推动自动响应之前发布这样的功能,从而显着降低开发新ML驱动功能的时间成本,并为实验和迭代打开大门。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com