* 语音交互- */>
智能语音交互
汇聚语音识别、语音合成、自然语言理解等技术
深度理解语音内容并赋予与人交流及反馈的能力
语音算法模型可以根据实际场景训练提升识别效率
智能语音识别的原子能力
深度语义解析
支持50多个领域的语义理解
多语种和多方言识别
支持普通话、粤语、
英文、方言等识别
中文标点智能断句
内容理解和停顿智能匹配合适
的标点符号(包括,。!?)
数字格式智能转换
转换数字序列、小数、时间、
分数、基础运算符正确转换
智能语言纠错
根据语音的内容理解自动
纠正为正确内容
批量快速识别
支持批量上传、
批量输出识别结果
识别结果支持时间戳
识别返回的文字结果带有时间戳,
切分句子开始和结束时间
丰富场景音库
支持在线/离线语音合成,
语速、音调、音量灵活设置
智能语音识别的核心功能
录音音频识别
实时语音交互
语音定制化及合成
深度自我学习
结合自然语言识别及机器学习技术,提供丰富及可持续深化的语音交互体验
毫秒级实时识别与反馈
语义理解准确
配置简单可定制
核心功能应用场景
会议/庭审语音转写
通过丰富的日常语音数据库以及行业关键词的积累, 如司法/政务等,提高语义理解的准确度,识别准确率高达97%。 充当秘书或书记员的角色,实现输出文字自动识别、自动纠错, 自动断点,自动总结。
解决的业务难点
通过对会议/庭审等音频的识别与语义理解,智能语音识别技术可以 将语音直接转变为文字,自动纠错,有效将重要会议/庭审重要信息 作为会议纪要、庭审笔录直接使用。