一、对于在训练后识别错误率太高的解决
在程序完成正负样本的训练后,运用于实际识别场景中时出错率太高的情况,刚开始一直以为训练样本太少导致的识别错误太高而疯狂的增加样本数量,识别精度分类器归并太低而修改识别精度,分类器参数,从而导致机器训练负荷超载,训练缓慢等情况发生。一度以为程序实现有问题,直到拿训练好的程序直接识别正负样本发现存在一定的误识别而发现的问题(不清楚这是怎个情况,回来再去研究下)自己以为的训练副本不一定就充分训练了。
二、针对问题利用自己的小工具进行自监督训练
对于正样本,工具加载所有训练图片进行逐个识别,对于无法识别图片单独拿出来,将相关信息存储后,有人工进行甄别处理对于需要的样本特征不明显的人工去除掉,对于需要的进行分析并增加相关的图片进行训练。
对于负样本,工具加载所有训练图片后进行逐个识别,对于错误识别内容进行记录后,截取相应区域内容后放入负样本进行训练,并对错误图片进行标记,对于反复训练无法规避错误图片进行记录交由人工进行分析处理。