产品介绍

为开发者提供精准的语音识别服务,即支持实时的指令同时也支持多种格式短音频,包括pcm、wav、ogg等。主要应用于社交聊天、智能家居等多场景智能语音交互

技术特色

  • 91%以上的准确率

    先进的识别技术,融入声智高水平的声源定位、多麦降噪、回声消除技术

  • 支持多语言和方言

    支持中、英两种语言识别,还支持粤语、四川话、东北话等方言

  • 个性化热词识别

    海量热门词汇,并针对识别效果差的专有名词支持上传热词,增强识别准确性

  • 快捷的信息沟通

    识别结果响应时间150~200ms,识别耗时是音频时长*0.3,高效的速度让语音沟通变得无比顺畅

应用场景

智能家居

为智能家居设备提供远场语音控制能力,充分满足家居家电的应用需求

社交聊天

使用社交应用聊天时,将语音信息转化成文字

语音搜索

为已有得搜索软件提供语音搜索的形式,让搜索更便捷高效

传统电器

人机交互时,将双方的语音信息转成文字信息,提升交互体验

常见问题

如果是方言的话需要标注出来么?
需要的,现在支持的方言有湖北、四川、东北、山东、河南、粤语,需要在请求头中标注出上传的音频是什么方言,不同方言支持的音频格式不尽相同,请到表格中进行对照
语音识别服务支持哪些音频格式和采样率?
目前语音识别服务仅支持16KHz和8KHz两种采样率,其他采样率如48KHz建议重采样到16KHz后再调用语音识别服务,每种服务支持的音频格式不尽相同,请到各个的服务页面中进行查看
地名人名识别出错?
这些属于专属词汇,请整理专属词汇成热词表,上传热词表之后,在请求头中加上此词表id,可以优化专有词汇的转译效果,上传热词的具体方法,请转到热词页面进行查看

我们为您提供个性化的售前购买咨询服务,以及全面的技术售后服务

400-699-9510