关键词:
甲骨文
深度学习
目标检测
数据集
YOLOv8算法
摘要:
甲骨文目标检测是甲骨文数字化研究中重要一环,主要依靠深度学习模型实现对甲骨文图像中位置信息和分类信息的识别。为了避免模型过拟合,深度学习模型的训练一般需要依赖大规模的数据集,而在甲骨文目标检测领域,目前可用于深度学习的大规模数据集较少,很多研究所用的数据集均依靠专家人工标注和整理,这使得甲骨文目标检测数据集存在整理成本较高、数据量较小、数据质量不高、类别间均衡性差等问题。提出了动态两阶段Mosaic算法及甲骨文大规模数据集生成技术,解决传统Mosaic算法在处理甲骨文图像中存在的拼接图数量有限、图像的多样性和差异性不足、空白背景较大、信息缺失等问题,并设计了完整的数据集生成流程,实现了从甲骨文单字符图片到大规模数据集生成的流程化、智能化处理,从根本上解决了甲骨文目标检测领域的数据困境。通过此研究方法,生成了标注位置信息和类别信息且规模庞大的甲骨文数据集,共生成57万张甲骨文图像和57万份对应的标注文件,包含甲骨文类别416类,样本数量最少的类别包含了516个甲骨文字符,且数据集规模和各类别样本数量可动态调整以避免类别间样本不均衡。采用YOLOv8模型对生成后的大规模数据集进行训练,在经过200批次训练后,模型精度(Precision)达到96.45%,mAP50值为97.75%,mAP50-95值为96.96%,从模型训练曲线看,训练过程表现出较好的稳定性和高效性,模型训练结果表明,研究的数据集生成技术可应用于甲骨文目标检测。