BP神经网络中输入向量的处理(字符识别)
方式一:尺寸归一化,对于小图像,训练时可以用线扫描,拼接图像成一维二值化的向量作为输入向量,目标点为1,背景点为0。(使用S型函数,范围从0-1);而输出神经元个数等于类别数,输出向量为对应哪个类,则该类对应的位置为1,其他为0。
方式二:尺寸归一化,使用接受器,接受器表示为一个具有任意大小和方向的多个行的集合。任何接受器如果和字母相交这输入向量值为1, 如果不和字母相交则输入向量值为0, 一个输入向量的大小将和接受器的数量相同。
- 优点:
-
我们能够用少量的接受器训练大图像的神经网络;
-
我们总是可以轻松地调整我们的接受器集,因为它们定义为包含两个坐标的多个行;
-
我们可以尝试产生一个相当小的接受器集合,它只用最显著的字母特征来识别出整个训练集。
-
- 缺点:
-
不能识别复杂的图案,原因是我们需要太多的接受器来表示特征;
-
如何生成接受器集?我们将随机生成一个大的接受器的集合, 然后我们会选择一个指定的最合适的接受器数量,如何指定接受器数量是好还是不好?可尝试用信息论里的熵。
方式三:提取目标的特征,以特征数目为输入神经元数目。
