Pinteres的人工智能分类系统
2020年01月13日 由 TGS 发表
848814
0
Pinterest开发了一个分类知识管理系统,可以实现内容级别的理解。它能对每个实体进行分类,并定义它们之间的关系,目的是提高搜索和分类任务所涉及平台AI模型的准确性。
分类法支持20个国家的17种语言,未来还将支持更多语言,它在整个平台上组织流行的主题,并为广告和正在进行的活动管理兴趣节点。兴趣被组织在一个分层的父-子树结构中,其中每个子是它的单个父类的一个子类,顶级分类节点定义了广泛的垂直类别。
如果不将管脚映射到所述分类的机制里面,分类法就没有多大用处。因此,内容工程团队构建了Pin2Interest(P2I),这是一个内容分类系统,它负责接收嵌入、文本视觉输入以及板名,为其他人工智能模型创建个性化推荐和排名功能。这个分类法的有用性超过了趋势主题跟踪。例如,它可以计算诸如每个分类法节点的用户数量之类的统计数据,以便让广告商了解总体兴趣的变化。
兴趣分类在将用户与他们可能喜欢的内容进行匹配方面起着至关重要的作用。这是一个多步骤的过程,包括资源描述框架(RDF)和开源本体开发环境WebProtege的使用,以促进更新的工程工作流。
RDF用于创建图形(其中包含连接到节点的节点和边),而WebProtege用于创建可视化,Pinterest的科学家们采用XML格式的RDF图,为下游的使用生成关系数据库表。对于分类法的迭代,团队在创建新版本时,通常会使用启发式规则执行添加新节点、重命名现有节点、删除节点和合并两个或多个节点等操作。
在分类法中添加新主题之前,内容工程团队首先会将候选术语发送到内容、法律部门和其他部门进行审查。然后,使用一个名为神经分类法扩展(NTE)的人工智能系统,预测现有节点和父候选项的可能性。对预测的父类进行手动审查,确保分类法功能的质量,最后,分类学家会将节点添加到WebProtege中的当前分类中。