汉字89%、符号98%、字母98%、数字96%,通过测试结果分析可以看出,数字的识别准确率已比较高,但文字识别准确率还有待提高,ocr识别字库需要不断训练积累,需要一定的时间,需要不断扩充识别字库来满足需求。二维码测试结果:发票二维码内的信息都是符号和数字,符号和数字识别率已到达96%。
识别速度达到OCR识别每张图片2.1s,二维码识别每张图片1.95s
3.2 票据提取部分测试结果
经过测试发现并解决问题,测得本设计图像处理平均时间为396秒
4 总结
本课题通过使用Matlab软件与Tesseract开源OCR引擎进行设计研究,对会计人员没有完整的自动化发票单据报账软件这一问题做出尝试,通过对OCR引擎的熟悉与训练,通过使用Matlab软件进行程序的开发,实现了从发票单据的图片输入、输入图片处理、有效数据的截取、数据的录入到通过程序进行自动报账,这样一系列完整的功能,证明了全流程的自动化报账软件实现是非常有前景的。
参考文献:
[1] 安然.基于OCR技术的原始凭证电子化管理系统的设计与 实现[D].吉林:吉林大学,2016.
[2] 陈东霞.浅谈高校财务预约报账系统的构建[J].会计之友, 2012,(35):127-128.
[3] 陈隆伟,张晓琼,黄昌勇.会计电算化全通用理论与会计软 件的全通用[A].财会月刊,2005,(1):5-6.
[4] 邓继忠,张泰岭.数字图像处理技术[M].广州:广东科技出 版社,2005.
[5] 吴狄,张冠伟.基于二维码识别技术的工业企业设备管理 系统的开发与应用[J]].数字技术与应用,2015,06.
[6] 祝锡萍,企业财务系统[M].杭州:浙江大学出版社,2009: 2-3.