腾讯云:一句话语音识别API接入步骤和说明
2019年07月26日 由 Aaron 发表
273735
0
语音识别 API 升级到 3.0 版本。全新的 API 接口文档更加规范和全面,统一的参数风格和公共错误码,统一的 SDK/CLI 版本与 API 文档严格一致,给您带来简单快捷的使用体验。支持全地域就近接入让您更快连接腾讯云产品。
相关接口
接口名称:SentenceRecognition
接口功能:一句话识别, 对60秒之内的短音频文件进行识别,达到快速准确识别较短语音的效果,可应用于语音消息转写等场景。
接口描述
接口请求域名: asr.tencentcloudapi.com 。
本接口用于对60秒之内的短音频文件进行识别,支持本地语音文件上传和语音URL上传两种请求方式。
当音频文件通过请求中body内容上传时,请求大小不能超过600KB;当音频以url方式传输时,音频时长不可超过60s。
所有请求参数放在POST请求的body中,编码类型采用x-www-form-urlencoded,参数进行urlencode编码后传输。
现暂只支持中文普通话和带有一定方言口音的中文普通话识别,支持识别8k16bit和16k16bit的mp3或者wav格式的单声道音频。
默认接口请求频率限制:25次/秒。
输入参数
以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见:cloud.tencent.com/document/api/1093/35640
输出参数
示例
通过语音URL形式调用接口:
用户通过语音url(http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav)的方式(SourceType为0)请求一句话识别服务,服务的引擎模型为:电话 8k (EngSerViceType = 8k),一句话语音的采样率为8k,声道数为单声道,长度为159768字节。
输入:
https://asr.tencentcloudapi.com/?Action=SentenceRecognition
&ProjectId=0
&SubServiceType=2
&EngSerViceType=8k
&SourceType=0
&Url=http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav
&SecretId=111
&Timestamp=111
&VoiceFormat=wav
&UsrAudioKey=www
&DataLen=159768
&<公共请求参数>
输出:
{
"Response": {
"Result": "张先生,您好。那个为了规范保险从业人员的销售行为,也为了更好的保护您的合法权益。",
"RequestId": "8984d9a9-343f-4c67-8fd9-5c79510a12da"
}
}
开发者资源
API Explorer:该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用:console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=SentenceRecognition&SignVersion=
命令行工具:cloud.tencent.com/document/product/440/6176
错误码
业务逻辑相关
公共错误码:返回结果中如果存在 Error 字段,则表示调用 API 接口失败。 Error 中的 Code 字段表示错误码,所有业务都可能出现的错误码为公共错误码,下表列出了公共错误码。
文章来源腾讯云 ,查看更多相关文档请访问https://cloud.tencent.com/document/product