让我们从网络连接开始。 network 函数的工作方式并不直观。为了控制您的输入向量是否正确描述了结构,您可以使用view(net):
现在让我们简要讨论每个参数:
numInputs - 如果您的网络将只获得一个输入数据集,您需要将1 放在这里。
numLayers - 对于 iris 数据集,可以在这里使用 2。
biasConnect - 偏置单元用于“增加”输入和输出之间的非线性。我们希望网络能够逼近复杂的非线性函数,这就是为什么在两层都添加偏置单元是个好主意。所以把[1, 1]放在这里。
inputConnect - 向量的维度为numLayers-by-numInputs。它显示哪些输入连接到哪些层。你只有一个输入连接到第一层,所以把[1;0]放在这里。
layerConnect - 向量的维度为numLayers-by-numLayers。你有两层。第一层连接到第二层,但不连接到自身。从第二层到第一层没有连接,第二层不给自己喂食。把[0 0; 1 0]放在这里。
outputConnect - 向量的维度为1-by-numLayers,并显示连接到输出的层。把[0 1]放在这里。
这是我们的命令和对应的图表:
net = network(1, 2, [1; 1], [1;0], [0 0; 1 0], [0 1]);
您可以对参数进行试验,得到的结构可能非常复杂。
网络配置
现在您需要配置网络。您可以在文档中找到所有参数,我将在这里描述最重要的:
为层设置正确的激活函数很重要。默认情况下,该函数设置为purelin。您可能想在这里使用tansig 或logsig 之类的东西。
你需要设置每一层的大小。在你的情况下,我会在第一层使用 5 或 7 个单位。第二层的大小应等于输出类的数量:在您的情况下为3。
还应为每一层设置权重和偏置单元的初始化函数。
生成的网络如下所示:
代码如下:
net = network(1, 2, [1; 1], [1;0], [0 0; 1 0], [0 1]);
net.adaptFcn = 'adaptwb';
net.divideFcn = 'dividerand'; %Set the divide function to dividerand (divide training data randomly).
net.performFcn = 'mse';
net.trainFcn = 'trainlm'; % set training function to trainlm (Levenberg-Marquardt backpropagation)
net.plotFcns = {'plotperform', 'plottrainstate', 'ploterrhist', 'plotconfusion', 'plotroc'};
%set Layer1
net.layers{1}.name = 'Layer 1';
net.layers{1}.dimensions = 7;
net.layers{1}.initFcn = 'initnw';
net.layers{1}.transferFcn = 'tansig';
%set Layer2
net.layers{2}.name = 'Layer 2';
net.layers{2}.dimensions = 3;
net.layers{2}.initFcn = 'initnw';
net.layers{2}.transferFcn = 'tansig';
[x,t] = iris_dataset; %load of the iris data set
net = train(net,x, t); %training
y = net(x); %prediction
view(net);
混淆矩阵看起来很不错。所以网络运行良好!
有点射击的方式
如果你想使用已经预装的网络,你可以使用这个代码:
[x,t] = iris_dataset;
net = patternnet;
net = configure(net,x,t);
net = train(net,x,t); %training
view(net);
y = net(x); %predict