随着移动设备新技术的发展,文档图像获取途径突破了扫描仪的限制,手机拍摄越来越受到欢迎。在电力运维检修现场,手机拍摄操作票更方便快捷。与扫描仪得到的干净规整图像不同,手机拍摄的文档图像存在光照变化强烈、清晰度低、笔迹潦草等特点。手写字体与印刷字体差异性大,书写习惯因人而异,缺乏规范性,横竖不直、撇捺不斜、笔画不清等加大了文字识别的难度[1]。OCR(传统光学字符识别)技术能够准确识别清晰成像的操作票印刷文字,但在其他场景,尤其是手写字体的识别上存在较大困难,为实现操作票电子化管理带来了挑战。20 世纪90 年代,深度学习神经网络模型受到了学术界的重视,逐渐发展成熟,在自然语言处理、模式识别、图像识别等领域涌现了大量前沿方法。DBN(深度信念网络)[2]、SAE(堆叠自动编码器)[3]、CNN(卷积神经网络)[4-5]、RNN(循环神经网络)[6]等方法为文字识别难题提供了新的解决思路。近年来,研究者提出了很多基于深度学习的文字识别方法。针对卷积神经网络,本文将文字识别方法归纳为以下3 类。