ClaraLabs的机器学习

2016年07月05日 由 荟荟 发表 300718 0
克拉拉实验室 正在建立一个结合了最好的人力和机器人才的同事。像机器一样,克拉拉总是记得偏好。像一位优秀的助手一样,Clara非常重视每条消息的细微差别,并有助于建立作为团队成员的丰富关系。为了实现这种自动化但社会娴熟的体验,人员和机器工作并一起学习,以在我们认为是合作智能的积极反馈循环中完成任务。

我们的平台使Clara远程助理(CRA)成为超人类:他们可以处理来自数百名客户的复杂请求,而每个客户或对话几乎没有任何先验背景。相反,传统的远程助理可以处理最多三到五个客户端。通过机器学习(ML)进一步放大比例,用于部分(有时完全)自动化工作。

实时人在环系统缩短了新ML驱动功能的上市时间。

构建实时人在环系统可缩短新ML驱动功能的上市时间,并对预测如何集成到平台中产生重大影响。我们很乐意分享我们对这些问题的看法。

克拉拉的机器学习

首先,一点背景。监督ML算法需要带注释的训练数据。在最基本的设置中,每个数据点采用形式(例如,注释); 例如,我们可能有一对(“我正在复制我的助手来设置一些东西。”,REQUEST_SCHEDULE)。构建一个好的数据集有两个关键方面:

1.示例应与我们在应用程序中预期的类似。如上例所示,安排请求很难找到维基百科短语或新闻文章的语料库。
2.必须为目标应用程序精确注释每个示例。
训练样例越具代表性,注释越好,预测结果就越好。获得这样的注释数据可能是困难且耗时的,因为通常需要数万个独特的例子。在实践中,原始数据示例被执行到执行繁琐注释任务的承包商; 疲劳经常导致许多注释错误和噪声数据。

我们的平台在以下方面脱颖而出。

我们为人和机器共同设计

调度任务被分解为可由人和机器理解的子任务,紧密耦合软件设计和人工过程。仔细考虑必须注释的内容通常会增加易处理性预测模型。

我们的数据质量很高,因为注释者“得到它”

CRA通常隐含地扮演注释者的双重角色。因此,我们的助手在执行Clara任务时表现越好,我们的训练数据质量就越高。此外,数据质量是跨学科(如UX)和公司团队的首要考虑因素。

小数据集很快成为大数据集

人工监督意味着预测一开始不需要高度准确,能够快速启动新的学习驱动的产品功能。我们快速测试新想法,而无需花费大量资源来构建数据集和调优算法。换句话说,我们的机器学习工作非常灵活。

敏捷ML:一个简单的例子

并非我们所有的ML功能都开始纯粹用于自动化。这方面的一个例子就是我们对助手的同情提示。

黑色水平线上方的文本是发送给Clara的示例消息。带下划线的黄色短语按我们的算法分类为“疾病”和第一人称。基于这些参数生成黑色水平线以下的建议响应。

如图所示,我们检测到移情反应何时适合,生成建议并将其呈现给助理。CRA可以选择轻松地在传出消息上添加响应。选择后,这将作为我们数据集的注释,并带来更好的客户体验。我们可以在准确到足以推动自动响应之前发布这样的功能,从而显着降低开发新ML驱动功能的时间成本,并为实验和迭代打开大门。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消