矿怪联机打怪游戏在游戏中有什么特殊符号组合吗?

基于blstm的联机打怪游戏手写数学公式符号识别方法

[0001] 本发明属于模式识别与人工智能技术领域特别是涉及一种联机打怪游戏手写数学公式符 号识别方法。

[0002] 移动终端的大量普忣使直接通过手写输入数据的方法,成为人类与计算机进行 互动的最自然的方式数学公式是二维文档,需同时传递一维空间中的符号信息和符号与 符号间的空间信息。符号与空间位置不同表达不同含义因此,手写数学公式识别是手写识 别领域中最具挑战性的重要部汾

[0003] 目前数学公式输入主要依靠特殊的公式描述语言或公式编辑器。相比直接由手写 输入的人机交互方法来说更加复杂和困难不符合高速运转的现代生活节奏。20世纪60年 代有学者开始着手对数学公式识别进行研究,但受技术限制数学公式识别发展缓慢。近 些年计算机技术高速发展,需要处理的公式、方程等信息越来越多数学公式识别又重新 引起科学界关注。全世界大学的研究者如德国工业大学、法國南特大学、美国麻省理工学 院、加拿大皇后大学、捷克理工大学、日本东京大学等纷纷加入联机打怪游戏手写数学公式识别研 究中。聯机打怪游戏手写数学公式识别竞赛(Competition on Recognition of Online Handwritten Mathematical ExpressionsCR0HME)于2011年开始举办,为全世界参赛者提 供了用以研究的数据集目的就是促进手写公式识别突破当前技术瓶颈。

[0004] 目前比较流行的方法是使用模式识别的手段对数学公式中的符号进行识别及分 类例如,"汉王e粉笔"可在一般计算机上使用并识別略为繁复的数学表达式;数学公式可 视编辑器Infty Editor是一款可处理复杂公式且输入简便的软件;法国Vision Object公 司出品的一款基移动终端的手写数学计算器MyScript简单直观,界面友好可将手写公式 转化为文本并提供计算结果,但对于一些特殊符号的识别不太好且预设可以计算的功能 因此设置叻一些语法规定,可识别的数学公式自由度不高

[0005] 本发明的目的在于利用计算机处理方法,提供一种联机打怪游戏手写数学公式识别方法 不需进行复杂的数学公式显性切分,而采用双向长短时记忆递归神经网络-时域连接分类 器(BLSTM-CTC)混合模型进行隐性简单切分减少一般公式识別方法中的工作量,提高手写 数学公式的识别精度

[0006] 本发明采用的技术方案如下。

[0007] 基于BLSTM的联机打怪游戏手写数学公式符号识别方法对联機打怪游戏手写输入的数学公式,用隐 性分割模型对数学公式符号进行处理及识别然后进行公式分析;

[0008] 具体包括如下步骤:

[0009] 1)联机打怪游戲手写数学公式预处理切分:预处理模块完成笔迹归一化,再进行重采样及 时间序列上的特征提取具体使用隐性分割模型,通过重采样得箌时间序列上的简单分割 每个采样点为分割片断,不需要在预处理时对公式进行精确切分;

[0010] 2)标签置换:使用整体识别方法对多部件特殊苻号进行整体标注,利用ASCII码 表中的空位将多部件特殊符号转换为单字符表达标签;

[0011 ] 3)用双向长短时记忆递归神经网络-时域连接分类器(BLSTM-CTC)组合模型进行 数学公式字符识别:通过双向长短时记忆神经网络(BLSTM)实现数学公式序列字符在一维 空间上的识别,并通过时域连接分类器(CTC)连接技术對无分割公式序列进行标签,使时 间序列上的采样点标签可以匹配到真值序列标签从而将字符级别的识别结果通过时域连 接模型上升到序列级别。

[0012]进一步地步骤(1)中笔迹归一化具体操作如下:使用笔划数目简单估计数学公式 宽度,针对整条公式做大致范围内的归一化处理克服书写公式大小不统一的问题。

[0013 ]进一步地步骤(1)中时间序列上的特征提取具体操作如下:在时序空间上对每个 时间点上的重采样点提取如下几个特征:采样点X轴坐标,采样点y轴坐标书写方向(c〇S0, sin0)笔迹曲率(cosa,sina)以及是否为笔迹起落点;每个笔划开始点和结尾点的书写方 姠与曲率和相邻点一致;其中Θ是当前采样点前后点连线与X轴正方向的夹角,a是采样点前 后两点的书写方向的夹角sin和cos分别是正弦函数和余弦函数。

[0014] 进一步地步骤(2)具体操作如下:使用整体识别方法,对多部件特殊符号进行整 体标注利用一种专门用于表达数字墨水的数据格式InkML文件中LaTex(公式描述语言)标 签,将所有数学公式中的符号根据ASCII码转置为单字符具体做法如下:标签符号本身在 ASCII码表中存在的则不改变,根据ASCII碼将所有多字符标签转化为易于标记及识别的单 字符标签;

[0015] 另外每当两点之间标签变化时,便在两者之间插入一个空白单元作为标签转換 标志因此除不同符号的91个标签之外,由于加入了空白单元使用的标签共有92个。

[0016] 进一步地步骤(3)中BLSTM模型结构及优化规则定义如下:使鼡BLSTM拓扑结构, 神经网络模型中每个记忆模块含有一个记忆单元隐藏层神经元在每个方向上的数目为 100个,联机打怪游戏手写数学公式每个筆划重采样得到20个采样点每个采样点取7个特征;对应神 经网络输入层有7个神经元,输出层大小为92其中91个基本标签及一个"空格"标签;BLSTM 训练的囸向与反向传播算法中,正向传播算法中输入序列在两个隐藏层中被排列成相反方 向;输出层直到两个隐藏层全部将输入序列处理完毕后財会更新;反向传播算法中输出层 的在整个时期以相反的方向在两个隐藏层传递反馈信息

[0017] 进一步地,步骤(3)中BLSTM模型的正向传播算法操作步骤洳下:

[0018] 第一步计算向后递归的由时间1到T隐藏LSTM神经元的状态值,保存所有时间点 的神经元输出a%

[0019] 第二步计算向前递归的由时间T到1隐藏LSTM神经え的状态值,保存所有时间点 的神经元输出 ?

[0020] 第三步对每个时间点的两层隐藏神经的叠加。

[0021] 进一步地BLSTM-CTC神经网络模型进行数学公式字符识別特征在于所述步骤(3) 中BLSTM模型的反向传播算法操作步骤如下:

[0022]第一步,在输出层中进行反向传播存储每一个时刻损失函数的偏导δ%

[0023]第二步,使用St在向前递归的隐藏层中由Τ到1做反向传播;

[0024] 第三步使用δ*在向后递归的隐藏层中由1到T做反向传播。

[0025] 进一步地所述步骤(3)中时域连接模型CTC模型结构及优化规则定义如下:

[0026]用CTC直接标记无分割序列,将BLSTM网络输出作为基于标签序列所有可能性的概 率分布通过条件限制给定嘚输入序列;通过给定的这个分布,目标方程可以直接获得正确 标签的最大可能性;

[0027] CTC网络输出层的神经元数目比标签数量L多一个一开始| L |个單元的激活函数 为特定时间上观察到的相关标签的概率,多余单元的激活函数为观察到"空格"或无标签的 概率这些输出用输入序列定义了所有可能标签序列的校准路径概率,标签序列的所有概 率值即可在不同校准路径概率求和时找到;

[0028] 对于一个长度为Τ的输入序列X定义一個拥有m个输入、η个输出的递归神经网络, 并将其权重向量定义为连续的映射Nw:(R m)T-(Rn)T,式中RmR n分别是m维示输入和η维输出 矢量,(Γ)τ,(Rn)τ是输入输出的转置矢量;令 y = Nw(X)为网络输出序列X为单元k在时刻t 的输出激活;.V[也可看作标签k在时亥Ijt上的概率,它通过长度为T的序列在L"T集合上定义 了┅个分布:

[0031]假设不同时间点的神经网络输出之间相互条件独立给出网络内部状态,定义一 个多对一的映射B:L"T-I/TI/T为可能的标签集,然后将所有的"空格"标签及重复标签从 路径中移除,当神经网络识别标签从"空格"变到非"空格"标签或从一个标签转至另一标签 时上述方法对应输出┅个新标签;最后通过B定义给定的标签lei/ T的条件概率为所有与 之对应的路径的概率之矛

[0032] 分类器的输出应为输入序列最有可能的标签序列/々IΜ ;找箌标签 序列的过程称作解码过程,采用前缀搜索解码法通过修改前向后向算法来实现,高效计算 出所有前缀标签连续扩展得到的标签序列的概率;

[0033]假设现有长度为r的序列q用qi:P和qr-P+i :r分别定义最开始及最后的ρ个符号,定 义前向变量at(s)为在时亥Ijt标签序列l1:s可能性

我要回帖

更多关于 联机打怪游戏 的文章

 

随机推荐