2023年2月8日星期三

描述性统计分析-1

7.1.1方法云集

summary()函数可以用来获取描述性统计量,包括:最大值,最小值,四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。

vars <- c("mpg", "hp", "wt")
summary(mtcars[vars])

可以借助sapply()函数计算所选择的任意描述性统计量,其格式为

sapply(x, FUN, options)

x: 数据框(矩阵)

FUN: 为一个任意的函数,常用的典型函数例如:mean、sd、var、min等

options:将被传递给FUN

图基五数总括,包括:最小值,下四分位数、中位数、上四分位数、最大值,可以通过fivenum()实现。

fivenum(mtcar$mpg)

例7-2 通过sapply()计算描述性统计量

mystats <- function(x, na.omit=FALSE){
 if (na.omit)
   x <- x[!is.na(x)]
 m <- mean(x)
 n <- length(x)
 s <- sd(x)
 skew <- sum((x-m)^3/s^3)/n
 kurt <- sum((x-m)^4/s^4)/n - 3
 return(c(n=n, mean=m, stdev=s, skew=skew, kurtosis=kurt))  
}
sapply(mtcars[vars], mystats)


没有评论: