一、Hog方向梯度直方图(Histogram of Oriented Gradient, HOG)
在计算机视觉以及数字图像处理中梯度方向直方图(HOG)是一种能对物体进行检测的基于形状边缘特征的描述算子,它的基本思想是利用梯度信息能很好的反映图像目标的边缘信息并通过局部梯度的大小将图像局部的外观和形状特征化。
HOG特征的提取可以用下面过程表示:
- 颜色空间的归一化是为了减少光照以及背景等因素的影响;
- 划分检测窗口成大小相同的细胞单元(cell),并分别提取相应的梯度信息;
- 组合相邻的细胞单元成大的相互有重叠的块(block),这样能有效的利用重叠的边缘信息,以统计整个块的直方图;
- 并对每个块内的梯度直方图进行归一化,从而进一步减少背景颜色及噪声的影响;
- 最后将整个窗口中所有块的HOG特征收集起来,并使用特征向量来表示其特征。
二、SVM支持向量机(Support Vector Machine, SVM)
是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane) 。
SVM使用铰链损失函数(hinge loss)计算经验风险(empirical risk)并在求解系统中加入了正则化项以优化结构风险(structural risk),是一个具有稀疏性和稳健性的分类器 [2] 。SVM可以通过核方法(kernel method)进行非线性分类,是常见的核学习(kernel learning)方法之一 。
SVM被提出于1964年,在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法,在人像识别(face recognition)、文本分类(text categorization)等模式识别(pattern recognition)问题中有得到应用
三、训练自己分类器
这里我们以一个游戏(DNF)为蓝本开始收集训练所需要的正负样本,样本大小选定为64*128,block 16*16,cell 8*8,正样本(Pos)3890,负样本(neg)6608,作为训练对象进行训练。
- 需要运动物体样本,需要控制运行的物体,本次测试选择游戏中的一个角色为控制运动的物体,通过训练后识别出物体的空间位置。
- 障碍物样本,妨碍运动物体移动的障碍物等。
通过训练自己的分类器来识别运动物体的坐标从而标定运动物体的空间位置,设定运动场场景的大小,物体运动速度,根据障碍识别标定无法运动到的位置建立空间运动模型。
四、物体运动规划
根据设定生成的空间运动模型,设置需要的运动到的位置,根据运动模型返回数据与实时识别系统修正来控制运动物体的详细运动路线,从而达到物体运动的规划与实施。
简单运动场景实现(房间→北方避难所→天帐兽区→)
(回来录制好运动视频在放出控制视频)