0


R语言进行K折交叉验证问题

在使用R语言进行模型参数评估优化时候,会使用K折交叉验证,其中会遇到各种各样问题:

  1. 错误: C5.0 models require a factor outcome
  2. > (1-mean(E0));(1-mean(E1))
  3. [1] 1
  4. [1] 1

报错说明C5.0模型需要因子变量输出,源代码如下:

  1. ### 10折交叉验证 ###
  2. # 导入car数据集
  3. car <- read.table("car.data",sep = ",")
  4. # 对变量重命名
  5. colnames(car) <- c("buy","main","doors","capacity",
  6. "lug_boot","safety","accept")
  7. # 手动构建10折交叉验证
  8. #下面构造10折下标集
  9. library(caret)
  10. ind<-createFolds(car$accept,k=10,list=FALSE,returnTrain=FALSE)
  11. # 下面再做10折交叉验证,这里仅给出训练集和测试集的分类平均误判率。
  12. E0=rep(0,10);E1=E0
  13. library(C50)
  14. for(i in 1:10){
  15. n0=nrow(car)-nrow(car[ind==i,]);n1=nrow(car[ind==i,])
  16. a=C5.0(accept~.,car[!ind==i,])
  17. E0[i]=sum(car[!ind==i,'accept']!=predict(a,car[!ind==i,]))/n0
  18. E1[i]=sum(car[ind==i,'accept']!=predict(a,car[ind==i,]))/n1
  19. }
  20. (1-mean(E0));(1-mean(E1))

针对报错,将 a=C5.0(accept~.,car[!ind==i,])代码前面加上因子变量:

  1. car$accept<-as.factor(car$accept)

修改代码如下:

  1. ### 10折交叉验证 ###
  2. # 导入car数据集
  3. car <- read.table("car.data",sep = ",")
  4. # 对变量重命名
  5. colnames(car) <- c("buy","main","doors","capacity",
  6. "lug_boot","safety","accept")
  7. # 手动构建10折交叉验证
  8. #下面构造10折下标集
  9. library(caret)
  10. ind<-createFolds(car$accept,k=10,list=FALSE,returnTrain=FALSE)
  11. # 下面再做10折交叉验证,这里仅给出训练集和测试集的分类平均误判率。
  12. E0=rep(0,10);E1=E0
  13. library(C50)
  14. car$accept<-as.factor(car$accept)
  15. for(i in 1:10){
  16. n0=nrow(car)-nrow(car[ind==i,]);n1=nrow(car[ind==i,])
  17. a=C5.0(accept~.,car[!ind==i,])
  18. E0[i]=sum(car[!ind==i,'accept']!=predict(a,car[!ind==i,]))/n0
  19. E1[i]=sum(car[ind==i,'accept']!=predict(a,car[ind==i,]))/n1
  20. }
  21. (1-mean(E0));(1-mean(E1))

这样就输出了正确结果。

附:利用caret包中的trainControl函数完成交叉验证。

  1. # 利用caret包中的trainControl函数完成交叉验证
  2. #install.packages("caret")
  3. library(ROCR)
  4. library(caret)
  5. control <- trainControl(method="repeatedcv",number=10,repeats=3)
  6. model <- train(accept~.,data=car,method="rpart",
  7. trControl=control)
  8. model
  9. plot(model)

标签: r语言 开发语言

本文转载自: https://blog.csdn.net/2301_76574743/article/details/140499857
版权归原作者 卡卡_R-Python 所有, 如有侵权,请联系我们删除。

“R语言进行K折交叉验证问题”的评论:

还没有评论