语音自学习平台_定制语言模型_语音识别

< 智能语音交互

语音自学习平台

语音自学习平台提供“开箱即用”语音识别效果优化能力，支持热词、语言模型等全流程的识别效果优化功能，同时支持CPU与GPU服务计算，让合作伙伴自主、自助定制出垂直领域语音识别模型。

通义听悟免费体验火热进行中，体验用大模型做学习笔记、会议记录！

产品文档

活动与推广

新产品轻量化声音克隆开启邀测，纯API定制音色，免切分免标注！

新产品通义听悟开启公测，你的工作学习AI助手！

新产品模型即服务Dashscope灵积平台已上线，开启模型探索之旅！

新产品大模型时代下的语音识别模型服务来了！不排队，普惠价的AI识别！

新产品大模型时代下的语音合成模型服务来了，高精拟人音色助力数字人等场景！

新产品语音合成精品定制服务正式上线，打造专属精品音色！

新功能北京、深圳正式开服，有效降低链路时延（最高可达200ms）！

最新活动阿里云智能语音支持离线部署，提供轻量化本地部署方案！

产品功能

语音自学习平台提供“开箱即用”语音识别优化能力

基础模型提供多个行业场景基础模型、行业先进技术基础模型，满足各类用户对定制化场景的需求。

语言模型目前阿里云语音提供免费定制语言模型服务，用户可以自行上传数据，对阿里的语音技术进行深度定制，从而提升特定业务领域的识别准确度。

热词在业务专业领域有部分词汇识别效果不够好时，可以使用热词功能，阿里语音技术支持用户配置上千个热词，并提供测试工具，用以改善识别结果。

自动化测试提供模型自动化测试能力，用户可通过上传测试集来评测模型的准确率等指标，直观感受训练效果。

产品优势

易用

提供一键式自助语音优化方案，极大地降低进行语音智能优化所需要的技术门槛。

快速

能够在数分钟之内完成业务专属定制模型的优化测试上线，更能支持业务相关热词的实时优化。

准确

优化效果在内外部案例中得到充分验证，解决了效果可用性问题。

语言模型定制流程

准备标注测试集

基础模型选择推荐

准备文本训练集

模型自动训练

应用实例

人工智能配网调度员

在杭州虚拟人工智能配网调度员项目中，合作伙伴使用自学习平台，大幅优化识别效果。

多语种模型自建

某合作伙伴使用自学习平台在一个月之内从无到有打造了全新的俄罗斯语和阿拉伯语语音识别模型，识别率达到业界优秀水平。

智能疫情机器人

疫情期间，湖北的智能疫情机器人使用阿里语音AI自学习平台，湖北口音语音识别率显著提升。

常见问题

更多问题，欢迎加入钉群咨询：44949861

优化人名、地名针对特有词汇，建议使用泛热词；针对人名、地名，优先使用类热词；类热词、泛热词使用时，词表中数量有限制，如果需要大量的热词，需要改用定制语言模型。

其他优化方法如果自学习工具无法满足需求，建议采用声学模型优化，可以加入钉群咨询：44949861，也可邮箱联系我们：nls_support@service.aliyun.com。

更多产品与服务

通义听悟

通义听悟支持在课程、会议、访谈等场景下实时转录和音视频转文字，智能生成总结，实时翻译打破跨语言沟通障碍。通义听悟还支持快速标记关键信息，识别结果和笔记能够轻松下载并分享给其他用户，让信息流动起来。

一句话识别

对时长较短（一分钟以内）的语音进行识别，适用于较短的语音交互场景，如语音搜索、语音指令、语音短消息等，可集成在各类App、智能家电、智能助手等产品中。

语音合成

语音合成服务，通过先进的深度学习技术，将文本转换成自然流畅的语音。目前有多种音色可供选择，并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。

录音文件识别

对用户上传的录音文件进行识别，上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

文档与工具