腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。ASR提供业界非常具有性价比的语音识别服务,超高识别准确率。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、法庭/审讯记录、语音输入法等多个场景。
腾讯云语音识别ASR活动&公告
- 客户端 TRTC 接入实时语音识别技术指引上线,了解更多 >>
- 语音识别产品已开始支持上海话方言,了解更多 >>
- 语音识别产品已支持日语,了解更多 >>
- 录音文件识别产品已支持多人话者分离功能,了解更多 >>
- ASR demo功能体验,demo支持普通话,英语和粤语语音识别,立即体验>>
语音识别ASR优惠套餐
新用户专享资源包,免费领取>>
一句话识别 5,000 次调用实时语音识别 5 小时时长录音文件识别 10 小时时长;自购买之日起 当月 有效 0元享受该资源包。
一句话识别资源包,立即购买>>
30,000 次调用;自购买之日起 一年 有效;90元/年。
实时语音识别资源包,立即购买>>
30 小时时长;自购买之日起 一年 有效;90元/年。
录音文件识别资源包,立即购买>>
60 小时时长;自购买之日起 一年 有效;90元/年。
语音识别ASR产品子功能
实时语音识别
对不限时长的实时音频流进行识别,识别结果自动断句,标记每句话的开始和结束时间;可应用于智能语音助手、法庭庭审记录等实时音频流场景。
录音文件识别
对用户上传的五小时之内的录音文件进行识别;可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。
一句话识别
对一分钟之内的短音频文件进行识别;可应用于语音输入法、语音消息转文字、语音搜索等场景。
语音识别ASR产品优势
价格低
购买预付费包更加优惠,识别1小时语音不到1元。每月赠送免费额度,最大程度降低客户成本。
效果好
字准率97%处于业界领先水平,与微信、王者荣耀的语音转文字使用一套服务,效果一样好。
语种多
已经支持中文普通话、英语、粤语、韩语、日语和上海话方言的语音识别 ,后续将陆续开放其他语种和方言的识别能力。
算法强大
基于创新网络结构 TLC-BLSTM,利用 ATTENTION 机制有效地对语音信号进行建模,通过 Teacher-Student 方式提升系统鲁棒性,对通用以及垂直领域下场景有领先业界的识别精度和效率。
自助提升准确率
针对垂直领域,上传词表或句子即可完成语言模型的自动优化,借助自训练平台,不懂算法也可轻松实现定制化模型,进一步提升识别准确率。
支持场景丰富
经过内部微信、腾讯视频、王者荣耀等大流量产品的充分验证,在互联网、金融、教育等领域,基于海量数据实现分场景优化,积累了多行业的最佳实践。
语音识别ASR应用场景
呼叫中心录音质检
业务痛点:传统质检严重受限于人的工作效率和人力成本,只能抽检不能全检,难以评估客服的真实工作质量。
解决方案:语音识别将电话录音识别为文本,再通过质检规则对文本进行分析,识别不符合规范的服务通话记录。
价值提升:大幅提升呼叫中心工作质量管控能力,完成人力不可能完成的超大规模电话录音质检工作,提升呼叫中心人员的服务质量。
短视频字幕
业务痛点:在拍摄 Vlog 的场景中,用户会边拍视频边说话;拍完视频还需要二次编辑,手动输入字幕才能将视频发布。
解决方案:通过语音识别能力,实现了用户边拍边说,将语音内容直接显示在视频上。
价值提升:大大减少了用户后期处理的成本,使得用户拍摄后即可发布。
庭审信息转写
业务痛点:之前需要通过书记员对庭审进行记录,记录过程中耗费人力,也会带有书记员的主观理解。
解决方案:通过语音识别直接将庭审各方的语音转化为文本,庭审的各方可以在过程中实时查看,结束后作为庭审笔录保存。
价值提升:提升了书记员的工作效率,完整还原了庭审的现场情况。