变量的重编码
重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程
要重编码数据,客户似医用R中的一个或多个逻辑运算符
表4-3 逻辑运算符
运算符 | 描述 |
---|---|
< | 小于 |
<= | 小于或等于 |
> | 大于 |
>= | 大于或等于 |
== | 严格或等于 |
!= | 不等于 |
!x | 非x |
x|y | x或y |
x&y | x和y |
isTRUE(x) | 测试x是否为TRUE |
不妨假设你希望将leadership数据集中经理人连续性年龄变量age重编码为类别性变量agecat(Young、Middle Aged、Elder)。首先,必须将99岁年龄值重编码为缺失值,使用代码为
leadership$age[leadership$age == 99] <- NA
语句variable[condition] <- expression,将会仅在condition的值为TRUE是执行赋值。
在指定好年龄中的缺失值之后,你可以接着使用一下代码创建agecat变量
leadership$agecat[ladership$age > 75] <-"Elder"
ladership$agecat[ladership$age >= 55 & ladership$age <= 75] <-"Middle Aged"
ladership$agecat[ladership$age < 55] <-"Younger"
这段代码可以写成更紧凑的:
leadership <- within(leadership, {
agecat <- NA
agecat[age >75] <- "Elder"
agecat[age >=55 & age <= 75] <- "middle Aged"
agecat[age <55] <- "Younger"})
没有评论:
发表评论