功能体验
语音录入
识别结果
0:00 / 1:00
点击“话筒”开始录音,请对我说你想说的话,我可以识别你说的内容哦~
请允许浏览器获取麦克风权限
产品优势
识别准确率高
国内独创的LC-BLSTM-DNN/LFR-DFSMN混合模型,相对传统方法降低了30%的错误率,大幅提高了语音识别的精度。
超快的解码速率
国内独创的LFR解码技术,在不损失识别精度的情况下,将解码速率提高了3倍以上,大幅缩短了反馈时间,提升用户体验。
独创的模型优化工具
可以结合模型优化工具子产品,针对特定的领域定制专属模型,最大限度的提升识别效果。
广泛的领域覆盖
支持金融、保险、司法、电商、智能家居等多个领域。
适用场景
语音搜索
支持各种场景下的语音搜索,比如地图导航、浏览器搜索等。可以集成到任何形式的手机应用中,最大限度的解放双手。
语音指令
通过语音命令控制智能设备,实现快捷便利的操作。比如控制空调的开关、电视的换台等。可以集成到智能家居等设备中。
语音短消息
通过语音发送或者接收短消息。在不方便打字的情况下实现快速便捷的短信操作,比如音频短信转文字。
更多产品与服务
录音文件识别
对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
了解更多
实时语音转写
对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。
了解更多
语音合成
语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。目前有多种音色可供选择,并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。
了解更多
语言模型自学习工具
用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制,未来会推出上传音频数据对声学模型进行定制。
了解更多