百度AI高T详解四大关键技术
2018年10月25日 由 荟荟 发表
3305
0
10月19日,"百度大脑行业创新技术实战公开课"正式开课,来自百度大脑AI技术方向的高T、产品大牛、运营专家,从技术和产品层面对该方案进行了详细解读。现场究竟有发布了哪些"干货"?快来一起去看看!
10分钟可视化人脸注册 百万级人脸库毫秒响应
人脸技术作为较为成熟的AI技术之一,在各行各业的落地中都有着相当高的曝光率,堪称 "网红"技术。活动现场,百度相关负责人以人脸闸机、人脸考勤、人脸签到、人脸支付和安全监控为例,向在场开发者介绍了在企业服务领域,人脸技术的几个代表性应用及其技术关键点。
人脸技术能在企业里做什么?百度科技园本身就是一个完整的应用案例。通行上应用人脸闸机,1.5秒完内即可完成人脸捕捉、闸机放行全过程。此外,摄像头可同时采集多张人脸,进行多人同时考勤,拒绝"迟到一分钟"惨案。食堂支持人脸支付,忘带工卡也没关系。百度联盟峰会应用人脸签到,无需排长龙。据介绍,人脸技术已在百度科技园稳定运行了一年多,给员工带来了无比顺滑的体验。
在技术成熟度和稳定性方面,百度人脸技术可支持百万级人脸库,对于高流量大并发的情况有很好的支持,人脸识别API可以实现毫秒级响应。百度还为开发者提供了丰富的产品服务与开发工具,包括基础产品、解决方案、硬件、开发工具4类服务,可以满足离线、在线多种复杂网络环境的诉求,企业可根据自身的需求灵活接入。此外,还提供整体的人脸识别开发套件,包含算法、行业主板、显示屏以及专业摄像头,可一站式轻松解决人脸识别开发。
此外,活动现场还展示了一个无需代码的在线小工具。通过可视化配置,只需5到10分钟即可创建一个人脸注册页面,并能通过H5小程序等分享出去,可以快速实现人脸采集与注册,相当便捷。
财税、电子化、图文审核全击破 百度OCR带来的自动化办公方式
出趟差,报销报到身心俱疲?找卷宗,只能靠自己苦苦回忆?审核严,还得靠人工硬刚海量内容?基于百度OCR技术,活动现场展示了自动化财税、文档电子化及图文机器审核三大应用方案,帮助企业提高人效、降低成本。
在财税场景下,百度拥有丰富、精准的票据识别模板,比如增值税发票、出租车票、火车票识别率达99%,轻微偏移、错行的情况都能cover,而企业内特定的单据怎么办呢?活动现场产品经理展示了百度自定义模板文字识别产品(iOCR),仅需一张单据,5分钟即可完成一个自定义OCR模板。
合作伙伴淘丁的产品"木牛盒子"就借助百度OCR实现了智能财税。批量扫描单据,票据自动分类并结构化识别,生成凭证后,再去检查校验、生成企业的资产负债表,最终轻松完成计税、报税工作,极大节省了人力成本。
文档电子化方面,百度OCR支持10余种语言文字、20多种垂类识别模板,整体识别率高达98%。此外,通用文字识别(高精度版/高精度含位置版)还支持2W+的大字库识别,作为参考:《新华字典》有1万多个汉字,1990年出版的《辞海》有14872个汉字,百度OCR确实符合"大"字库的名号。重庆法院就使用百度通用文字识别对历史300万份起诉书和判决书进行了结构化,从而实现了案件信息智能检索。
在图文审核上,网络图片文字识别针对复杂背景、艺术字体进行了专项优化,全面提升了审核场景下的识别率。百姓网借助百度内容审核能力,使用网络图片文字识别+NLP文本审核对全站UGC图像进行审核,审核效率提升了15.1%,极大提升了站内审核的工作效率。
智能客服、电话质检、外呼机器人 百度语音能力助力电话客服
企业售前的电话销售、售后的电话客服,主要通过电话客服中心提供服务。电话客服往往有客服人员变动大、培训成本高、情绪不稳定、外包客服服务质量难监测等多种问题……公开课上展示的呼叫中心实时语音识别和音频文件转写,或可为企业呼叫中心提供多方位助力。
在活动现场,一段智能电话销售的Demo赢得了众多的惊叹。在销售与客户沟通的通话录音中,系统精准识别了销售与客户二人的语音流,实时生成文字,还能准确判断出客户的意图,并迅速推荐最佳应答方式。如客户表示"我需要信用卡会自己办理的",推荐话术"电话办理较银行办理更省时"就显示在了销售坐席的工作区。
实时获取声音讯号,精准地转化为文本流实时输出,无疑是后续实现语义理解、判断客户意图的基础。据介绍,基于呼叫中心通话数据专门训练,百度呼叫中心语音识别在电话场景中有优异表现,可应用于智能外呼/IVR场景。在质检场景中,可以基于语音流检测出客服坐席是否说出不礼貌用语,或没有说到一些定向的推荐词,并在系统中进行标注。
此外,呼叫中心音频文件转写,可将多场景的语音离线地转为文字,低成本的进行电话录音转写,支持通话后质检以及录音文件保存等。为后续业务应用提供高效率、低成本的音频转文字能力。
百度语音提供企业级的稳定保障能力:支持多并发通路,识别返回时效低于200ms,99.99%以上高可用性,全天候支撑呼叫中心各类智能化通话业务。
百度UNIT技术定制每个人的"贾维斯"
使用自然的语音和机器进行对话,是一个理想的人机交互方式。
设想客户或业务部门向企业支持中心每日的大量问询和业务处理,都能先通过机器进行优先级排列,真正完成令人满意的回复;在办公室,想请假、报销、询问IT问题、查询年假余额,张张嘴向手机提问就能做到……这些其实早已实现。10月18日,百度大脑行业论坛企业服务专场中,小能科技与致远互联就此分别做了深度分享,而这一切的实现,正是基于百度UNIT智能对话定制平台。
相比市面上智能对话、智能客服产品,百度在搜索上累积的经验和资源对UNIT来说是相当大的助力,因为搜索其实就是最简单的语义理解的过程。
小能科技联合创始人&CTO马立群回忆和UNIT达成合作的情景,"这个决策的时间特别短,短到可能只有一个星期的时间,我们了解到UNIT内置的词槽没记错应该是22大类,数量将近千万级,最重要的是当时UNIT的一个同学告诉我所有的这些词槽都来自于百度的大搜,我觉得这个词槽应该是全世界最全的中文词槽。"
基于长久的技术积累和庞大的数据沉淀,百度UNIT可以实现长达60字的长Query理解,以及相当逼近真人语音的外呼交互等。而用户只需提供少量数据,基于百度算法和预制数据就能达到相当优秀的效果。
近日,UNIT还全新上线了5项预制技能,包括订机票、问天气、看电影、接电话、订咖啡等办公场景高频对话,开发者无需收集语料训练,就可以直接调用快速定制对话机器人。
当然,通用语料是难以覆盖所有场景的, UNIT提供自然语言理解的技术和对话管理技术两个技术框架,为开发者提供强大的定制能力。活动现场,负责百度UNIT的4位工程师、产品经理等,详细解读了UNIT开发的全流程。
据悉,百度UNIT提供了最通用的API的方式,供不同的渠道对接。同时还提供了Android、iOS等常见系统的SDK。同时DuerOS平台和微信,也提供了一键接入的方式,未来还会有更多的方式接入使用。
此外,UNIT已经确认永久免费开放,除了免费的沙盒环境外,每个账号还可以免费使用三个商用环境,每个环境提供40QPS、每天不限量的调用配额,感兴趣的开发者可以登陆百度AI开放平台官网(
ai.baidu.com)了解详情。
2018年10月至12月,百度大脑行业创新论坛及技术实战公开课还将走进成都、深圳、上海、苏州和武汉,围绕信息服务、地产物业、智慧零售、智慧工厂等六大议题,与全国各地的开发者、行业企业共同探讨如何用AI技术赋能业务场景,共同见证AI与行业融合的无限可能。