语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令 的能力。在智能时代,越来越多的场景在设计个性化的交互界面时,采用以对话为主的交互形式。一个完整的对话交互是由“听懂——理解——回答”三个步骤完成的闭环,其中, “听懂”需要语音识别(Automatic Speech Recognition, ASR)技术;“理解”需要自然语 言处理(Natural Language Processing, NLP)技术; “回答”需要语音合成(Text To Speech,TTS)技术。三个步骤环环相扣,相辅相成。语音识别技术是对话交互的开端,是保证对话交互高效准确进行的基础。