毕业设计之 --- 基于深度学习视觉的自动做题机器人

文章目录

前言
一、效果展示
二、实现方式及使用算法
- 1.原理简述
最后

前言

一个拍照做题程序。输入一张包含数学计算题的图片，输出识别出的数学计算式以及计算结果。请查看系统文档说明来运行程序。注意，这是一个半开源的项目，目前上传的版本只能处理简单的一维加减乘除算术表达式（如果想要识别更加复杂的表达式，可以参考数学公式识别的论文）。可以参考的代码是前面字符识别部分以及整个算法处理框架。

推荐大家用于毕业设计。。。。

一、效果展示

这里简单的展示一下效果

毕业设计之 --- 基于深度学习视觉的自动做题机器人

二、实现方式及使用算法

1.原理简述

这里只进行简单描述，需要用到该算法的读者留言

整个程序使用python实现，具体处理流程包括了图像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。

本程序使用opencv对输入的图像进行预处理，并将字符裁剪出来再归一化成固定大小的矩阵。我在TensorFlow上实现了一个lenet5 的卷积神经网络用来识别数学字符，训练使用CHROME数据集。对于数学公式的识别，主要是将识别出的独立的字符组织成计算机能够理解的数学公式（这里的数学公式就是纯字符的可求解的数学计算题）。大概的方法是使用编译原理的算符优先法和递归下降法进行实现。然后根据属性文法的值传递思想，将数学公式的值计算出来。最后使用python的matlibplot库把计算过程和答案打印出来。

最后

优点：这是一整套拍照做题的算法框架，同时能够处理多种多样的计算题，目前市面上还没有看到实现。OCR技术如此成熟的今天字符识别已经不算有挑战的东西了。缺点：字符空间关系判断只用了人类启发式规则，图像预处理不够鲁棒，数学公式的结构识别算法不够完美（可以考虑使用二维文法来做）。系统还有很大的提升空间。

毕业设计之 --- 基于深度学习视觉的自动做题机器人