当前位置: 首页 > 数据分析师 > 数据分析师学习教程 > 数据相关的分析方法是什么?这三种才是数据分析师的救星

数据相关的分析方法是什么?这三种才是数据分析师的救星

更新时间:2020-07-10 10:55:09 来源:环球网校 浏览174收藏34
摘要 对于两个要进行相关性分析的数据序列,通常在进行相关性分析之前,假设两列数据之间没有相关性。在进行相关分析后,数据相关的分析方法是什么?这三种才是数据分析师的救星,现在就思考一下数据相关的分析方法是什么?这三种才是数据分析师的救星。

对于两个要进行相关性分析的数据序列,通常在进行相关性分析之前,假设两列数据之间没有相关性。在进行相关分析后,可以得到两个定量指标:相关系数和显著性检验概率。其中,检验概率值反映不相关的可能性。如果概率小于0.05,说明两个数据序列之间存在相关性。相关系数反映了相关程度和方向。相关系数的绝对值越大,两列数据之间的相关性越强。相关系数的符号表示数据是正相关还是负相关。相关分析虽然可以找到变量之间的相关程度,但不能证明变量之间的因果关系和函数关系。

1、数据相关的分析方法是什么——两个高测量变量

•皮尔逊相关:适用于距离变量(连续变量)和正态分布的两列,两列数据个数相同,对应关系;可以得到两列数据之间的相关系数和相关检验概率。

Spearman相关性:适用于距离变量或高测度排序变量两列,分布未知,数据个数相同,对应关系;得到两列数据的秩分与相关检验概率之间的相关系数。

•肯德尔相关:适用于两列序数变量,未知分布。两列数据个数相同,对应关系相同;您可以获得两列数据的相关性级别和相关性的测试概率

•偏相关:多列间距变量或高测量序列变量,正态分布,消除控制变量的影响;将控制变量掩蔽后进行相关检验,得到两列数据的相关系数和相关检验概率。

2、数据相关的分析方法是什么——高和低测量变量

•方差分析:因变量为序数变量或高测度序数变量,符合正态分布;因子变量是序数变量或类变量。将各因素按不同水平进行分组,并检查各组间的差异,以反映各因素变量与因变量之间的相关性。

•K独立样本非参数检验:因变量为序数变量或高测度序数变量,不符合正态分布;因子变量是序数变量。将各因素按不同水平进行分组,并检查各组间的差异,以反映各因素变量与因变量之间的相关性。

3、数据相关的分析方法是什么——两个低测量变量

•测序变量的相关性分析:根据不同值的交叉点计算两列低测量的测序变量。基于交叉点的频率进行卡方检验,发现不同组之间的频率差异,从而反映定量变量之间的相关程度。

•独立分析的分类变量:两个列表的分类变量,计算每组的频率基于交集点具有不同的值,进行卡方检验基于交集的频率点,以及不同群体之间的频率差,以反映分类变量的独立性。

数据相关的分析方法是什么?这三种才是数据分析师的救星,对于两个要进行相关性分析的数据序列,通常在进行相关性分析之前,假设两列数据之间没有相关性。在进行相关分析后,你能处理好吗?如果您还担心自己入门不顺利,那么下方的资料下载链接一定会帮助你。

数据分析师备考资料全部免费下载

  • 考试大纲
  • 备考计划   
  • 真题答案与解析
  • 易错练习
  • 精讲知识点
  • 考前冲刺提分   
点击领取资料

分享到: 编辑:环球网校

资料下载 精选课程 老师直播 真题练习

数据分析师资格查询

数据分析师历年真题下载 更多

数据分析师每日一练 打卡日历

0
累计打卡
0
打卡人数
去打卡

预计用时3分钟

数据分析师各地入口
环球网校移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载

返回顶部