summary()
函数可以用来获取描述性统计量,包括:最大值,最小值,四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。
vars <- c("mpg", "hp", "wt")
summary(mtcars[vars])
可以借助sapply()
函数计算所选择的任意描述性统计量,其格式为
sapply(x, FUN, options)
x: 数据框(矩阵)
FUN: 为一个任意的函数,常用的典型函数例如:mean、sd、var、min等
options:将被传递给FUN
图基五数总括,包括:最小值,下四分位数、中位数、上四分位数、最大值,可以通过fivenum()
实现。
fivenum(mtcar$mpg)
例7-2 通过sapply()
计算描述性统计量
mystats <- function(x, na.omit=FALSE){
if (na.omit)
x <- x[!is.na(x)]
m <- mean(x)
n <- length(x)
s <- sd(x)
skew <- sum((x-m)^3/s^3)/n
kurt <- sum((x-m)^4/s^4)/n - 3
return(c(n=n, mean=m, stdev=s, skew=skew, kurtosis=kurt))
}
sapply(mtcars[vars], mystats)
没有评论:
发表评论