有趣的mathAI项目，手写拍照自动能解高数题还不快试试？

电子工程师 2019-05-19 6231

电子说

1.3w人已加入

描述

让我们不妨先来盘点下从 2016 年起过去三年间 Google I/O 开发者大会亮相的重磅 AI 产品：

深度好玩！文章开始红色石头先在草稿纸上写一道高数微积分题目给大家看看如何求解：

怎么算呢？趁着高数知识还没忘完，赶紧拿起纸演算起来。大部分人是这么做的。但是如果现在跟你说，可以用 AI 来做，你信吗？

现在就有这样一个 AI 程序，你只要轻松上传上面这张手写算术题，程序就能帮你自动分析，写出解题步骤和答案！你信吗？就像下面一样：

Amazing！有没有！今天就给大家介绍这个有趣的 mathAI 项目。它是一个拍照做题程序。输入一张包含数学计算题的图片，就会自动输出识别出的数学计算式以及计算结果。

项目介绍

该项目名为：mathAI，是一个自动计算手写公式的程序。作者是一名中山大学的学霸硕士小哥 Roujack，他的研究方向就是计算机视觉。

整个程序使用 Python 实现，具体处理流程包括了图像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。

整个系统流程图如下：

1. 预处理

首先，需要对手写图片进行预处理。图片预处理以 OpenCV 作为主要工具。预处理的主要目的是把图片中的字符切割出来，同时避免无关变量对字符识别的影响。

预处理主要包括：灰度化、二值化、高斯滤波、字符切割与细化。

对图片预处理的效果如下图所示：

2. 字符识别

预处理之后，下一步就是对字符进行识别。选择的模型是卷积神经网络 LeNet5，因为不需要提取字符特征值，而且图像识别精确度高。

训练网络选用的数据集是国际数学公式识别比赛数据集（CROHME）。CROHME 数据集具有海量字符集图片，而且图片类型与实际输入非常相似。每种字符有 400 张图片，其中 60% 的图片用于训练，40% 的图片用于测试。

接下来就是结构分析和语义分析。

总的来说，对于数学公式的识别，主要是将识别出的独立的字符组织成计算机能够理解的数学公式（这里的数学公式就是纯字符的可求解的数学计算题）。大概的方法是使用编译原理的算符优先法和递归下降法进行实现。然后根据属性文法的值传递思想，将数学公式的值计算出来。最后使用 Python 的 Matplotlib 库把计算过程和答案打印出来。

实验结果

模型训练完成之后，作者验证了字符识别的准确率：