数据挖掘大作业
下载链接:【数据挖掘大作业】基于决策树的评教指标筛选(weka使用手册+数据+实验报告)
一、考核内容
现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。指标内容详见表1。
*表***1 **学生评教指标体系及权重
序 号
指 标
权重(10%)
Index1
老师在第一节课能向我们介绍本课程的基本情况:课程在专业学习中的地位作用、课程性质(必修课还是选修课)、授课计划、考核性质和方式(考试课还是考查课、闭卷还是开卷等),本课程教学中课外作业、测验、期中与期末考试及实验(针对有实验的课程)等环节的评分比例。
10
Index2
老师严格按照课程教学大纲和授课计划所规定的教学内容、基本要求和教学进度进行教学,不任意增减课时和删减教学内容。
10
Index3
老师着装整洁,仪表大方;讲课语言准确、简练、生动、清楚,板书工整、文字规范,积极采用现代化教学手段以提高教学效果。
10
Index4
老师在上课中,理论阐述准确,概念清晰,条理分明,逻辑性强;重点突出、难点分散;改进教学方法,做到教学相长,师生互动。
10
Index5
上课中,老师注意激发我们积极思维,融会贯通所学知识,培养我们独立思考和分析、解决问题的能力;不断更新讲课内容,及时传递本学科发展的信息。
10
Index6
老师重视检查我们的出勤情况,根据实际情况采取抽查点名等方式;注意维持课堂秩序,教育督促我们遵守课堂纪律。
10
Index7
老师在上课时关闭通信设备,提前到达课堂做好课前准备工作,不提前下课。
10
Index8
老师注意了解我们的学习情况、解答疑难问题,引导我们学习;给我们提供了答疑的时间、地点、方式,在这一时间内,我们有问题都能找到老师解答。
10
Index9
老师在辅导答疑时耐心细致,主动进行质疑,督促我们学习。
10
Index10
老师批改作业认真、及时;指出了作业中的错误之处,并纠正我们的错误。
10
以此为研究数据,利用数据挖掘的技术实现评价指标的筛选,即从10个指标中剔除对教学评价无用的指标。具体实现的内容应至少包括以下几个方面但不限于:
(1)数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值;
(2)数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签;
(3)模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率);
(4)结果讨论:对研究结果(剔除的指标,即未出现决策树中的指标)进行讨论分析;
(5)总结与展望:对全文研究过程进行总结并指出存在的不足或努力方向。
第一章 绪 论
1.1 研究背景
教学评价是衡量高校教学质量的重要指标。它也是教学环节的基本组成部分。它关系到学生的学习效果和就业质量,目前的教学质量评价大多按照以下程序进行:一是教学主管部门结合学校实际情况制定评价指标和评价权重,然后通过网络对评价量表进行逐项打分。最后,教学管理部门根据网络分数划分教学质量评价等级,并以此作为评价教师优秀和年度评价的重要参考。通常,评价主体采用多元化方式,包括学生评价、同行互评、专家评价等[1-4],网络系统评分后,每个评价部分根据其重要性占据不同比例,如何合理利用数据挖掘技术对大量的教学评价数据进行处理和分析,发现隐藏在其背后的有价值信息,更好地服务于教师和教学管理部门,已成为亟待解决的问题[5-7] 。
第二章 数据描述
2.1 盒图(我用的spssau画的)
数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值
第三章 数据预处理
3.1数据预处理
数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签;
3.1.1原始数据
将原视数据导入weka中以后,在属性中remove“课程名称”和“评价人数”,然后将数据可视化,结果如下:
3.1.2数据离散化
使用weka的Filter中Discretize把10个连续型指标数据(Index)离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示),将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签,结果如下:
第四章 模型构建与评估
4.1.模型构建与评估
模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率)。
4.2模型构建
分类算法使用C4.5决策树学习算法(J48):
模型评估方法选择Percentage spilt 66%:
决策树模型:
版权归原作者 梦想减肥的dw 所有, 如有侵权,请联系我们删除。