【数据挖掘大作业】基于决策树的评教指标筛选（weka+数据+报告+操作步骤）

数据挖掘大作业

下载链接：【数据挖掘大作业】基于决策树的评教指标筛选（weka使用手册+数据+实验报告）

一、考核内容

现有某高校评教数据(pjsj.xls)，共计842门课程，属性包括：课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。指标内容详见表1。

*表***1 **学生评教指标体系及权重

序号

指标

权重（10%）

Index1

老师在第一节课能向我们介绍本课程的基本情况：课程在专业学习中的地位作用、课程性质(必修课还是选修课)、授课计划、考核性质和方式(考试课还是考查课、闭卷还是开卷等)，本课程教学中课外作业、测验、期中与期末考试及实验（针对有实验的课程）等环节的评分比例。

Index2

老师严格按照课程教学大纲和授课计划所规定的教学内容、基本要求和教学进度进行教学，不任意增减课时和删减教学内容。

Index3

老师着装整洁，仪表大方；讲课语言准确、简练、生动、清楚，板书工整、文字规范，积极采用现代化教学手段以提高教学效果。

Index4

老师在上课中，理论阐述准确，概念清晰，条理分明，逻辑性强；重点突出、难点分散；改进教学方法，做到教学相长，师生互动。

Index5

上课中，老师注意激发我们积极思维，融会贯通所学知识，培养我们独立思考和分析、解决问题的能力；不断更新讲课内容，及时传递本学科发展的信息。

Index6

老师重视检查我们的出勤情况，根据实际情况采取抽查点名等方式；注意维持课堂秩序，教育督促我们遵守课堂纪律。

Index7

老师在上课时关闭通信设备，提前到达课堂做好课前准备工作，不提前下课。

Index8

老师注意了解我们的学习情况、解答疑难问题，引导我们学习；给我们提供了答疑的时间、地点、方式，在这一时间内，我们有问题都能找到老师解答。

Index9

老师在辅导答疑时耐心细致，主动进行质疑，督促我们学习。

Index10

老师批改作业认真、及时；指出了作业中的错误之处，并纠正我们的错误。

以此为研究数据，利用数据挖掘的技术实现评价指标的筛选，即从10个指标中剔除对教学评价无用的指标。具体实现的内容应至少包括以下几个方面但不限于：

（1）数据描述：利用盒图对每个指标数据进行描述性分析，画出10个指标的盒图：标注孤立点（如有）、最小值、Q1、中位数、Q3、最大值；

（2）数据预处理：将每个连续型指标数据离散化为三个区间，级别从高到低分别为Excellent（用“E”表示）、Good（用“G”表示）、Fair（用“F”表示）；将总平均分离散为“A”、“B”、“C”三个等次，作为每门课程的类标签；

（3）模型构建与评估：利用决策树算法对上述数据进行分类，构建决策树并进行性能评估：包括Recall（召回率）、Precision（精度）、F1和Accuracy（准确率）；

（4）结果讨论：对研究结果（剔除的指标，即未出现决策树中的指标）进行讨论分析；

（5）总结与展望：对全文研究过程进行总结并指出存在的不足或努力方向。

第一章绪论

1.1 研究背景

       教学评价是衡量高校教学质量的重要指标。它也是教学环节的基本组成部分。它关系到学生的学习效果和就业质量，目前的教学质量评价大多按照以下程序进行：一是教学主管部门结合学校实际情况制定评价指标和评价权重，然后通过网络对评价量表进行逐项打分。最后，教学管理部门根据网络分数划分教学质量评价等级，并以此作为评价教师优秀和年度评价的重要参考。通常，评价主体采用多元化方式，包括学生评价、同行互评、专家评价等[1-4]，网络系统评分后，每个评价部分根据其重要性占据不同比例，如何合理利用数据挖掘技术对大量的教学评价数据进行处理和分析，发现隐藏在其背后的有价值信息，更好地服务于教师和教学管理部门，已成为亟待解决的问题[5-7] 。

第二章数据描述

2.1 盒图（我用的spssau画的）

数据描述：利用盒图对每个指标数据进行描述性分析，画出10个指标的盒图：标注孤立点（如有）、最小值、Q1、中位数、Q3、最大值

第三章数据预处理

3.1数据预处理

    数据预处理：将每个连续型指标数据离散化为三个区间，级别从高到低分别为Excellent（用“E”表示）、Good（用“G”表示）、Fair（用“F”表示）；将总平均分离散为“A”、“B”、“C”三个等次，作为每门课程的类标签；

3.1.1原始数据

    将原视数据导入weka中以后，在属性中remove“课程名称”和“评价人数”，然后将数据可视化，结果如下：

3.1.2数据离散化

    使用weka的Filter中Discretize把10个连续型指标数据（Index）离散化为三个区间，级别从高到低分别为Excellent（用“E”表示）、Good（用“G”表示）、Fair（用“F”表示），将总平均分离散为“A”、“B”、“C”三个等次，作为每门课程的类标签，结果如下：

第四章模型构建与评估

4.1.模型构建与评估

    模型构建与评估：利用决策树算法对上述数据进行分类，构建决策树并进行性能评估：包括Recall（召回率）、Precision（精度）、F1和Accuracy（准确率）。

4.2模型构建

分类算法使用C4.5决策树学习算法（J48）:

模型评估方法选择Percentage spilt 66%：

决策树模型：

标签：数据挖掘人工智能机器学习

本文转载自: https://blog.csdn.net/dw1360585641/article/details/125363169
版权归原作者 梦想减肥的dw 所有，如有侵权，请联系我们删除。