语音自学习平台
语音自学习平台提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,同时支持CPU与GPU服务计算,让合作伙伴自主、自助定制出垂直领域语音识别模型。

产品功能

语音自学习平台提供“开箱即用”语音识别优化能力
基础模型提供多个行业场景基础模型、行业先进技术基础模型,满足各类用户对定制化场景的需求。
语言模型目前阿里云语音提供免费定制语言模型服务,用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。
热词在业务专业领域有部分词汇识别效果不够好时,可以使用热词功能,阿里语音技术支持用户配置上千个热词,并提供测试工具,用以改善识别结果。
自动化测试提供模型自动化测试能力,用户可通过上传测试集来评测模型的准确率等指标,直观感受训练效果。

产品优势

易用
提供一键式自助语音优化方案,极大地降低进行语音智能优化所需要的技术门槛。
快速
能够在数分钟之内完成业务专属定制模型的优化测试上线, 更能支持业务相关热词的实时优化。
准确
优化效果在内外部案例中得到充分验证,解决了效果可用性问题。

语言模型定制流程

准备标注测试集
基础模型选择推荐
准备文本训练集
模型自动训练

应用实例

常见问题

更多问题,欢迎加入钉群咨询:44949861
优化人名、地名针对特有词汇,建议使用泛热词;针对人名、地名,优先使用类热词;类热词、泛热词使用时,词表中数量有限制,如果需要大量的热词,需要改用定制语言模型。
其他优化方法如果自学习工具无法满足需求,建议采用声学模型优化,可以加入钉群咨询:44949861,也可邮箱联系我们:nls_support@service.aliyun.com。

更多产品与服务

通义听悟
通义听悟支持在课程、会议、访谈等场景下实时转录和音视频转文字,智能生成总结,实时翻译打破跨语言沟通障碍。通义听悟还支持快速标记关键信息,识别结果和笔记能够轻松下载并分享给其他用户,让信息流动起来。
一句话识别
对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中。
语音合成
语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。目前有多种音色可供选择,并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。
录音文件识别
对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

文档与工具