相关性分析是最常用的分析策略之一,对于两组数据相关性结果的可视化,可以借鉴文献中的表现形式,图示如下 采用了组合图表的形式,主体是两组数据构成的散点图,在散点图中显
相关性分析是最常用的分析策略之一,对于两组数据相关性结果的可视化,可以借鉴文献中的表现形式,图示如下
采用了组合图表的形式,主体是两组数据构成的散点图,在散点图中显示线性拟合的直线,并标记相关系数和相关性检验的p值;同时在上方和右侧方,用直方图的形式展示看每组数据的各自分布。这样的一幅图表,把相关性分析的多种信息同时展现了出来,信息量丰富而且美观。
这样的一幅图如何来实现呢,下面来一步步进行探究,首先看下数据
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
我们对mtcars这个数据框中的mpg和wt 这两列数据进行相关性分析,首先使用ggpubr中的ggscatter函数绘制散点图,代码如下
> ggscatter(mtcars, x = "wt", y = "mpg")
效果图如下
和文献中的插图相比,我们需要做以下调整
1.添加回归直线和置信区间,并设置颜色
2.调整散点的大小
代码如下