MATLAB 支持向量机（SVM）

MATLAB 支持向量机（SVM）详细解释（含代码）

基础

线性可分

简单来讲就是如何将两个数据用点、直线、平面分开。。。。。
在这里插入图片描述
二维空间中，要分开两个线性可分的点集合，我们需要找到一条分类直线即可，

最大间隔超平面

通俗来讲，在这个二维平面中，可以把两类点的分开的直线有很多条，那么这些直线中，哪一条才是最好的呢？也就是如何选择出一条最好的直线呢？
在这里插入图片描述
先看橙色的点，如果这些点到分类直线的距离越大，分类直线也就越远离橙色的点，那么再来一个新的点，如果这个点是依照橙色点集合的特性产生的（也就是它不是一个相对于橙色点集合很奇异的点），那么这个点也很可能和橙色的点集合一样，分布在直线的同一侧。分布在同一侧，表明它和橙色集合点属于同一个类别。用同样的思想，图4中，对于灰色的集合点，这条分类直线离它们的距离也要越远越好。所以找最优分类线，就是要找到这条一条直线，使它到两个类别点的距离越大越好。
在这里插入图片描述

因此便可得到某根距离离两边都累计最远的直线，即最大分隔超平面。

在这里插入图片描述
上述也叫硬间隔最最大化，能够用直线将两者分开。

SVM分类

基本代码和工具

工具：1、MATLAB 2020a；2、fitcsvm

二分类

fitcsvm：fitcsvm训练或交叉验证支持向量机（SVM）模型在低维或中维预测数据集上的一类和二类（binary）分类。fitcsvm支持使用核函数映射预测数据，并支持通过二次规划实现目标函数最小化的顺序最小优化（SMO，sequential minimal optimization）、迭代单数据算法（ISDA，iterative single data algorithm）或L1软边界最小化。
代码:

线性

clc
clear all
%设置两类不同数据
A=[3,7;6,6;4,6;5,6.5];B=[1,2;3,5;7,3;3,4;6,2.7;4,3;2,7];C=[A;B];%两类数据合并

%设置不同类别标签
table =[truetruetruetruefalsefalsefalsefalsefalsefalsefalse];D=nominal(table);%%数据集和标签
sd=C;Y=D;%% 原始数据图像
subplot(1,2,1)gscatter(sd(:,1),sd(:,2),Y,'rg','+*');%%SVM
SVMModel=fitcsvm(sd,Y,'KernelFunction','linear');[lable,score]=predict(SVMModel,sd);%% 画图
subplot(1,2,2)
h =nan(3,1);h(1:2)=gscatter(sd(:,1),sd(:,2),Y,'rg','+*'); 
hold on
h(3)=plot(sd(SVMModel.IsSupportVector,1),sd(SVMModel.IsSupportVector,2),'ko');%画出支持向量

%画出决策边界
w=-SVMModel.Beta(1,1)/SVMModel.Beta(2,1);%斜率
b=-SVMModel.Bias/SVMModel.Beta(2,1);%截距
x_ =0:0.01:10;
y_ = w*x_+b;plot(x_,y_)
hold on
legend(h,{'-1','+1','Support Vectors'},'Location','Southeast');
axis equal
hold off

实验结果：
在这里插入图片描述

上述实验得到一个硬间隔最大化的分隔超平面

非线性

clc
clear all
%设置两类不同数据
A=[0.9,1;0.8,1.8;0.79,1.7;0.7,3;0.8,3.9;0.9,4.5;1.2,5.7;1.6,5.6;2.5,6.1;2.9,5.8;2.9,1;3.1,1.4;3.6,1.2;5,2;5.5,3.9;4.9,4.5;4.2,5.9;3.6,5.6;2.5,5.1;2.9,5.3];B=[2.5,3.1;3.5,2.6;4.5,3.2;3.5,2;2.4,2;3.5,2.5;4.3,3.7;2.6,2.8;2.4,3;3.6,3.1;4.4,3.3;2.5,4.0;3.5,4.1;4.5,4.2;1.5,4;2.4,4;3.5,4.5;4.3,3.7;3.6,3.8;2.4,3.5;3.6,3.7;4.4,3.3];C=[A;B];%两类数据合并

%设置不同类别标签
table =[truetruetruetruetruetruetruetruetruetruetruetruetruetruetruetruetruetruetruetruefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalsefalse];D=nominal(table);%%数据集和标签
sd=C;Y=D;%% 原始数据图像
subplot(1,2,1)gscatter(sd(:,1),sd(:,2),Y,'rg','+*');%% 原始数据图像
subplot(1,2,1)gscatter(sd(:,1),sd(:,2),Y,'rg','+*');%%SVM
SVMModel=fitcsvm(sd,Y,'BoxConstraint',10,'KernelFunction','rbf','KernelScale',2^0.5*2);%使用高斯核函数

%%SVMModel=fitcsvm(sd,Y,'KernelFunction','rbf','OptimizeHyperparameters',{'BoxConstraint','KernelScale'},'HyperparameterOptimizationOptions',struct('ShowPlots',false));%使用超参数优化

%% 画图
subplot(1,2,2)
h =nan(3,1);h(1:2)=gscatter(sd(:,1),sd(:,2),Y,'rg','+*'); 
hold on
h(3)=plot(sd(SVMModel.IsSupportVector,1),sd(SVMModel.IsSupportVector,2),'ko');%画出支持向量

%画出决策边界
h =0.2;[X1,X2]=meshgrid(min(sd(:,1)):h:max(sd(:,1)),min(sd(:,2)):h:max(sd(:,2)));%得到所有取点的矩阵
[lable,score]=predict(SVMModel,[X1(:),X2(:)]);
scoreGrid =reshape(score(:,2),size(X1,1),size(X2,2));contour(X1,X2,scoreGrid,[00]);%绘制等高线
hold on
legend('-1','+1','Support Vectors','分界线');
axis equal
hold off

实验结果：
在这里插入图片描述

上述实验进行非线性的数据分类

多分类

详细解释

一对多法（one-versus-rest,简称OVR SVMs）

训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类，这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类。

假如我有四类要划分（也就是4个Label），他们是A、B、C、D。
于是我在抽取训练集的时候，分别抽取
　　（1）A所对应的向量作为正集，B，C，D所对应的向量作为负集；
　　（2）B所对应的向量作为正集，A，C，D所对应的向量作为负集；
　　（3）C所对应的向量作为正集，A，B，D所对应的向量作为负集；
　　（4）D所对应的向量作为正集，A，B，C所对应的向量作为负集；
　　使用这四个训练集分别进行训练，然后的得到四个训练结果文件。在测试的时候，把对应的测试向量分别利用这四个训练结果文件进行测试。最后每个测试都有一个结果f1(x),f2(x),f3(x),f4(x)。于是最终的结果便是这四个值中最大的一个作为分类结果。
　　数据链接: [https://pan.baidu.com/s/1QUNknb-AV-cPt0hM_jSs_Q ]提取码：http
　　代码：

clc;
clear;
close all;%%导入数据：训练集、测试集、训练标签、测试标签
train_data=xlsread('train_data.xls');
group_train=xlsread('group_train.xls');
test_data=xlsread('test_data.xls');
test_labels=xlsread('test_labels.xls');%%绘数据分布图
gscatter(train_data(:,1),train_data(:,2),group_train);title('数据分布');xlabel('Fea1');ylabel('Fea2');%%% 训练数据分为5类
% 类别i的 正样本 选择类别i的全部，负样本 从其余类别中随机选择（个数与正样本相同）
%%% 类别1
class1_p =train_data(1:12,:);%randperm(n,k)是从1到n的序号中随机返回k个
index1 =randperm(48,12);
train_data_c = train_data;train_data_c(1:12,:)=[];%正样本
class1_n =train_data_c(index1,:);%负样本
train_features1 =[class1_p;class1_n];% 正类表示为1，负类表示为-1
train_labels1 =[ones(12,1);-1*ones(12,1)];%% 类别2
class2_p =train_data(13:24,:);%randperm(n,k)是从1到n的序号中随机返回k个
index1 =randperm(48,12);
train_data_c = train_data;train_data_c(13:24,:)=[];%正样本
class2_n =train_data_c(index1,:);%负样本
train_features2 =[class2_p;class2_n];% 正类表示为1，负类表示为-1
train_labels2 =[ones(12,1);-1*ones(12,1)];%% 类别3
class3_p =train_data(25:36,:);%randperm(n,k)是从1到n的序号中随机返回k个
index1 =randperm(48,12);
train_data_c = train_data;train_data_c(25:36,:)=[];%正样本
class3_n =train_data_c(index1,:);%负样本
train_features3 =[class3_p;class3_n];% 正类表示为1，负类表示为-1
train_labels3 =[ones(12,1);-1*ones(12,1)];%% 类别4
class4_p =train_data(37:48,:);%randperm(n,k)是从1到n的序号中随机返回k个
index1 =randperm(48,12);
train_data_c = train_data;train_data_c(37:48,:)=[];%正样本
class4_n =train_data_c(index1,:);%负样本
train_features4 =[class4_p;class4_n];% 正类表示为1，负类表示为-1
train_labels4 =[ones(12,1);-1*ones(12,1)];%% 类别5
class5_p =train_data(49:60,:);%randperm(n,k)是从1到n的序号中随机返回k个
index1 =randperm(48,12);
train_data_c = train_data;train_data_c(49:60,:)=[];%正样本
class5_n =train_data_c(index1,:);%负样本
train_features5 =[class5_p;class5_n];% 正类表示为1，负类表示为-1
train_labels5 =[ones(12,1);-1*ones(12,1)];%%% 分别训练5个类别的SVM模型
model1 =fitcsvm(train_features1,train_labels1,'ClassNames',{'-1','1'});
model2 =fitcsvm(train_features2,train_labels2,'ClassNames',{'-1','1'});
model3 =fitcsvm(train_features3,train_labels3,'ClassNames',{'-1','1'});
model4 =fitcsvm(train_features4,train_labels4,'ClassNames',{'-1','1'});
model5 =fitcsvm(train_features5,train_labels5,'ClassNames',{'-1','1'});%%% label是n*1的矩阵，每一行是对应测试样本的预测标签；
% score是n*2的矩阵，第一列为预测为“负”的得分，第二列为预测为“正”的得分。
% 用训练好的5个SVM模型分别对测试样本进行预测分类，得到5个预测标签
[label1,score1]=predict(model1,test_data);[label2,score2]=predict(model2,test_data);[label3,score3]=predict(model3,test_data);[label4,score4]=predict(model4,test_data);[label5,score5]=predict(model5,test_data);% 求出测试样本在5个模型中预测为“正”得分的最大值，作为该测试样本的最终预测标签
score =[score1(:,2),score2(:,2),score3(:,2),score4(:,2),score5(:,2)];% 最终预测标签为k*1矩阵,k为预测样本的个数
final_labels =zeros(20,1);for i =1:size(final_labels,1)% 返回每一行的最大值和其位置
    [m,p]=max(score(i,:));% 位置即为标签
    final_labels(i,:)= p;
end
% 分类评价指标

在这里插入图片描述

标签： matlab 算法人工智能

本文转载自: https://blog.csdn.net/Blame___/article/details/127910119
版权归原作者決决所有，如有侵权，请联系我们删除。

MATLAB 支持向量机（SVM）