英招

牢骚太盛防肠断,风物长宜放眼量

0%

最大信息系数(by R)

与相关性分析流程相似,画图工具包与相关性分析相同

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
#采用minerva包计算最大信息系数
library(minerva)
origindata <- read.table('E:\\data\\data.txt',encoding="UTF-8",header = T)
#多变量间相关性
#剔除第1列
data_cut<-origindata[,-1]
#剔除NA行
data_cut<- na.omit(data_cut)
#如果数据不全是numeric则执行这一步
#for (i in 1:length(data_cut)) {
# data_cut[,i]<-as.numeric(data_cut[,i])
#}

#存储最大信息系数的数据框与相关系数一致
cordata <- round(cor(data_cut),3)
micdata <-cordata
micdata[,]<-NA

#计算最大信息系数
for (i in 1:ncol(data_cut)) {
for (j in 1:ncol(data_cut)){
micdata[i,j]<-mine(data_cut[,i],data_cut[,j])$MIC
}
}
micdata <-round(micdata,3)

#画图
library(ggcorrplot)
p<-ggcorrplot(micdata,#数据
title="剔除降雨0值各参数最大信息系数",

#method = c("circle"),#method, 指定可视化的形状,可以是circle圆形(默认),square方形, ellipse, 椭圆形,number数值,shade阴影,color颜色,pie饼图。
type=c("lower"),#type,指定显示范围,可以是full完全(默认),lower下三角,upper上三角。
hc.order = TRUE,#参数是否分层聚类
outline.col ="white",#方块轮廓颜色
ggtheme = theme_bw()+
theme(plot.title = element_text(hjust = 0.5, size = 16)),

colors = c("#6D9EC1","white","#E46726"),#方块范围颜色
lab = TRUE,#方块内数字
lab_size = 4,
legend.title = "MIC"
)#方块内数字大小
p

#设置默认路径,即后续图片保存的位置
setwd("E:\\output")
jpeg(filename =paste0("参数最大信息系数.jpg"),width=1200,height=1200,res=150)#res 是指 PPI(Pixel Per Inch) ,即图像的采样率(在图像中,每英寸所包含的像素数目)
p
print(p)
dev.off()