作者笔迹识别中等宽和等频离散化方法的性能比较
1. 引言
在处理大量数据时,数据转换是工程、数学、物理和图像处理等领域的关键过程,离散化技术可用于构建更好的数据表示。通过对特定数据进行重构和转换,能为分类模型输入更优的特征值,从而提高分类准确率。
在作者笔迹识别研究中,特征表示过程十分重要,它能解决特征冗余或依赖问题,避免高维问题。离散化过程可将复杂数据转换为独特的特征表示,为特征值注入泛化因素,提高性能准确率,使分类器模型更易使用和学习。
本研究提出对作者笔迹图像构建两种离散化方法,即对高阶联合矩不变量(HUMI)特征采用等宽(EW)和等频(EF)离散化方法,并比较这两种方法的性能结果。
2. 文献综述
许多研究人员对监督和无监督离散化方法进行了研究,通过应用这些方法提高了分类准确率,使数据呈现更简单、一致和准确。例如,有研究提出将等宽分箱(EWB)作为独立离线笔迹数据集的监督离散化方法;还有研究提出了新的书写者识别方案,在离散化笔迹图像后进行特征排序。
此外,有研究将相关工作应用于双胞胎笔迹研究,以确定双胞胎之间的风格差异,其离散化特征的平均准确率高达97.66%;也有研究将EWB方法应用于汉字笔迹,用于监督离散化和书写者识别。还有研究通过系统文献和大量实验分析了最佳离散化方法及其对分类的影响,以及比较了几种监督和无监督离散化方法对连续特征的影响,发现无监督离散化方法显著改进了朴素贝叶斯和C4.5的归纳算法。
3. 方法
离散化分为监督和无监督两类,本研究采用的无监督离散化方法有等宽(EW)和等频(EF)离散化方法。
- 等宽(EW)离散化方
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



