0


【数据挖掘大作业】基于决策树的评教指标筛选(weka+数据+报告+操作步骤)

数据挖掘大作业

下载链接:【数据挖掘大作业】基于决策树的评教指标筛选(weka使用手册+数据+实验报告)

一、考核内容

现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。指标内容详见表1。

****1 **学生评教指标体系及权重

序 号

指 标

权重(10%)

Index1

老师在第一节课能向我们介绍本课程的基本情况:课程在专业学习中的地位作用、课程性质(必修课还是选修课)、授课计划、考核性质和方式(考试课还是考查课、闭卷还是开卷等),本课程教学中课外作业、测验、期中与期末考试及实验(针对有实验的课程)等环节的评分比例。

10

Index2

老师严格按照课程教学大纲和授课计划所规定的教学内容、基本要求和教学进度进行教学,不任意增减课时和删减教学内容。

10

Index3

老师着装整洁,仪表大方;讲课语言准确、简练、生动、清楚,板书工整、文字规范,积极采用现代化教学手段以提高教学效果。

10

Index4

老师在上课中,理论阐述准确,概念清晰,条理分明,逻辑性强;重点突出、难点分散;改进教学方法,做到教学相长,师生互动。

10

Index5

上课中,老师注意激发我们积极思维,融会贯通所学知识,培养我们独立思考和分析、解决问题的能力;不断更新讲课内容,及时传递本学科发展的信息。

10

Index6

老师重视检查我们的出勤情况,根据实际情况采取抽查点名等方式;注意维持课堂秩序,教育督促我们遵守课堂纪律。

10

Index7

老师在上课时关闭通信设备,提前到达课堂做好课前准备工作,不提前下课。

10

Index8

老师注意了解我们的学习情况、解答疑难问题,引导我们学习;给我们提供了答疑的时间、地点、方式,在这一时间内,我们有问题都能找到老师解答。

10

Index9

老师在辅导答疑时耐心细致,主动进行质疑,督促我们学习。

10

Index10

老师批改作业认真、及时;指出了作业中的错误之处,并纠正我们的错误。

10

以此为研究数据,利用数据挖掘的技术实现评价指标的筛选,即从10个指标中剔除对教学评价无用的指标。具体实现的内容应至少包括以下几个方面但不限于:

(1)数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值;

(2)数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签;

(3)模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率);

(4)结果讨论:对研究结果(剔除的指标,即未出现决策树中的指标)进行讨论分析;

(5)总结与展望:对全文研究过程进行总结并指出存在的不足或努力方向。

第一章 绪 论

1.1 研究背景

       教学评价是衡量高校教学质量的重要指标。它也是教学环节的基本组成部分。它关系到学生的学习效果和就业质量,目前的教学质量评价大多按照以下程序进行:一是教学主管部门结合学校实际情况制定评价指标和评价权重,然后通过网络对评价量表进行逐项打分。最后,教学管理部门根据网络分数划分教学质量评价等级,并以此作为评价教师优秀和年度评价的重要参考。通常,评价主体采用多元化方式,包括学生评价、同行互评、专家评价等[1-4],网络系统评分后,每个评价部分根据其重要性占据不同比例,如何合理利用数据挖掘技术对大量的教学评价数据进行处理和分析,发现隐藏在其背后的有价值信息,更好地服务于教师和教学管理部门,已成为亟待解决的问题[5-7] 。

第二章 数据描述

2.1 盒图(我用的spssau画的)

数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值

第三章 数据预处理

3.1数据预处理

    数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签;

3.1.1原始数据

    将原视数据导入weka中以后,在属性中remove“课程名称”和“评价人数”,然后将数据可视化,结果如下:

3.1.2数据离散化

    使用weka的Filter中Discretize把10个连续型指标数据(Index)离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示),将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签,结果如下:

第四章 模型构建与评估

4.1.模型构建与评估

    模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率)。

4.2模型构建

分类算法使用C4.5决策树学习算法(J48):

模型评估方法选择Percentage spilt 66%:

决策树模型:


本文转载自: https://blog.csdn.net/dw1360585641/article/details/125363169
版权归原作者 梦想减肥的dw 所有, 如有侵权,请联系我们删除。

“【数据挖掘大作业】基于决策树的评教指标筛选(weka+数据+报告+操作步骤)”的评论:

还没有评论