2026语音识别全栈国产化技术实践白皮书

《语音识别全栈国产化技术实践白皮书》阐述了一套基于基于紫光计算机集群和摩尔线程全功能GPU进行训练与推理的语音识别解决方案。该方案包含两大核心服务:适用于实时、低延迟场景的流式语音识别,以及适用于长音频、批量转写场景的离线语音转写。每个服务均自带完整音频预处理与后处理能力(VAD、ASR、标点生成与文本归一化ITN),同时该方案支持热词增强与垂直领域语言模型定制,输出可选字级时间戳与句子级时间戳,满足实时转写、检索索引和高精度后处理需求。该系统已通过国家工业信息安全发展研究中心的检测(即“国检”),并持有相应的检测报告与证书,验证了其在多种噪声环境下的稳定性与识别准确性。

  • 2026-06-02
  • 收藏0
  • 阅读0
  • 下载0
  • 23页
  • pdf
  • 1.22M

评价

评分 :
   *