2022年5月18日星期三

变量的重编码

变量的重编码

重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程

要重编码数据,客户似医用R中的一个或多个逻辑运算符

表4-3 逻辑运算符

运算符描述
<小于
<=小于或等于
>大于
>=大于或等于
==严格或等于
!=不等于
!x非x
x|yx或y
x&yx和y
isTRUE(x)测试x是否为TRUE

不妨假设你希望将leadership数据集中经理人连续性年龄变量age重编码为类别性变量agecat(Young、Middle Aged、Elder)。首先,必须将99岁年龄值重编码为缺失值,使用代码为

leadership$age[leadership$age == 99] <- NA

语句variable[condition] <- expression,将会仅在condition的值为TRUE是执行赋值。

在指定好年龄中的缺失值之后,你可以接着使用一下代码创建agecat变量

leadership$agecat[ladership$age > 75] <-"Elder"
ladership$agecat[ladership$age >= 55 & ladership$age <= 75] <-"Middle Aged"
ladership$agecat[ladership$age < 55] <-"Younger"

这段代码可以写成更紧凑的:

leadership <- within(leadership, {
   agecat <- NA
   agecat[age >75] <- "Elder"
   agecat[age >=55 & age <= 75] <- "middle Aged"
   agecat[age <55] <- "Younger"})

函数within()与函数with类似,不同的是它允许你修改数据框


没有评论: