一:团队成员介绍:
岳锴 (USTC) 耿子钢 (USTC) 袁靖松 (XJTU)
二:实现的项目计划:
项目计划:实现老师所给的项目一(手写数字增强版)。
预期目的:打算实现以下几个功能:
基本功能:
- 多个数字的识别
- 多个数字的加减法
- 支持加减乘除等基本运算
- 用户可以添加括号构造较为复杂的表达式进行计算
拓展功能:
- 支持浮点数的运算
- 对于输入不在预期数据内的数据,做出对应的错误处理
- 支持橡皮擦功能
- 支持语音输入
三:github地址:https://github.com/Handwrite/Handwrite_caculator
四:预期大致思路
基本功能:
- 多个数字的识别:采用图像分割算法,将不同位置的图像提取出来,进行识别。
- 多个数字的加减法:识别出用户输入的字符串后,检查表达式是否合法;将字符串转化为表达式,进行求值操作。
- 支持加减乘除操作:对原先数据集进行扩增,加入新的数据集合数据标签,然后对模型进行训练。
拓展功能:
- 浮点数的运算:仅打算支持小数,不支持分数。原因:小数点的识别同其他符号的识别类似,在一维顺序上等同于原先的模式,而分数的分数线将一个数据拓展到了二维,数字出现了纵向的排布,对于位置的判断和分数的判断有一定的难度。
- 支持处理不在数据范围内的数据:尝试获取识别信息的概率,通过判断概率范围,进行分类处理。
- 橡皮擦功能:对于橡皮擦所在的点,设置像素值为0。
- 语音输入功能:使用语音输入 api 解析输入的语句,将语句转化为对应的数字进行识别加减操作