进行相关分析
双变量相关 计算变量之间
皮尔逊相关系数(直接解读)
肯德尔(需要计算偏相关性)
斯皮尔曼(需要通过`*`与`**`的大小进行判断)
一. 分析花瓣长、花枝长与花萼长两两相关性关系
采用皮尔逊 双尾检验
显著性检验
双尾(双侧检验) 以0.01为检验标准
单尾(单侧检验) 以0.05为检验标准
数据为对称矩阵(对角线为1)
上图的Sig.(双尾) 与 花枝长的系数为0.00 < 0.01 => 有相关性 系数有效
二. 分析地位域、权威主义与顺从性两两相关性关系
数据分析
采用肯德尔 斯皮尔曼 双尾检验
肯德尔计算三个数之间哪两个相关性更大 可以使用 偏相关系数
X
X
X=地位欲
Y
Y
Y=权威主义
Z
Z
Z=顺从性
代入计算得 R
x
y
z
xyz
xyz=0.62 => 即偏相关系数更接近与Y =>
X
X
X与
Y
Y
Y的相关性与
Z
Z
Z无关
斯皮尔曼的相关系数一行可以看出在那一级别(双尾)下 相关性更强
0.818 > 0.615 => 地位欲在0.01级别时相关性更为显著
观察数值处于正负1附近时数值相关性更大
距离相关 计算记录(样本)之间
三.分析国家之间在森林面积、森林覆盖率、林木蓄积量与草原面积之间的相关性
分析数据 进行聚类分析
系统聚类
通过系统聚类将上述国家进行动态聚类
可以看出使用平方欧式距离来进行聚类 将7与15记录聚在一起
下一阶段是阶段6 再将记录4聚在一起
垂直冰柱图(直观动态归类过程)
可以看到垂直冰柱图的最低是 7与15 之间的柱子 再是 11与16 之间的柱子 再是 4与14 之间的柱子 再是 14与12 之间(即4与14与12 归为一类) 以此类推
可以自定义聚类统计等
可以看到分类变为自定义的个数
也可以在生成结果中添加图
数据转置
常用于将以行为数据参数的记录 转置为列排
K-均值聚类
数据分析
版权归原作者 dzy001016 所有, 如有侵权,请联系我们删除。