基于非平衡数据集SP - 9345861 VL - 2019 AB -的中文光学字符识别的焦点CTC损失我们提出了一种新的不平衡分布字符识别深度模型,该模型采用基于焦损的连接时间分类(CTC)函数。以往的工作是利用传统的CTC计算预测损失。然而,一些数据集可能由极不平衡的样本组成,如中文。换句话说,训练集和测试集都包含大量的低频率样本。在训练过程中,低频率样本对模型的影响非常有限。为了解决这一问题,我们对传统的CTC进行了改进,融合了焦损耗,使模型在训练阶段能够照顾到低频率的样本。为了证明该方法的优越性,我们在两类数据集上进行了实验:合成图像序列数据集和真实图像序列数据集。在两个数据集上的实验结果表明,所提出的焦CTC损耗函数在非平衡数据集上达到了预期的性能。具体来说,我们的方法比传统CTC的平均准确率高出3到9个百分点。 SN - 1076-2787 UR - https://doi.org/10.1155/2019/9345861 DO - 10.1155/2019/9345861 JF - Complexity PB - Hindawi KW - ER -