“闻其声而知其人”,人们通过听觉系统来感知辨别声音中的话者身份,古已有 之。而对机器而言,这种能力被称为说话人识别 (Speaker Recognition) ,又称声纹识别(Voiceprint Recognition) 。 与前文所述的语音识别不同,说话人识别并不考虑语音信号中的字词大意,它更关注于说话人信息,强调个性;而语音识别则更关注于语音信号中的言语内容,并不考虑说话人是谁,强调共性。通常将语音信号中所蕴含的、能表征说话人个性信息的语音特征称为声纹 (Voiceprint) 。声纹是一种行为特征,由于每个人在讲话时所使用的生理器官 (如舌头、口腔、鼻腔、声带、肺等)在尺寸和形态等方面均有所不同,再考虑到年龄、性格、语言习惯等因素上的差异,可以说每个说话人的声纹都是独一无二的 [1, 2]。说话人识别技术就是根据声纹的个体唯一性,自动识别话者身份的技术,属于生物特征识别技术的一种。