2022年5月20日星期五

数据集合并

如果数据分在在多个地方,需要在继续下一步之前将其合并。

添加列

要横向合并两个数据框(数据集),可以使用merge()函数。

在多数情况下,两个数据框是通过一个或多个共有变量进行联结的(即一种内联结,inner join),例如

total <- merge(dataframeA, dataframeB, by = "ID")

将dataframeA和dataframeB进行了个并

如果需要直接横向合并两个矩阵或数据框,并且不需要指定一个公共索引,那么可以直接使用cbind()函数:

total <- cbind(A, B)

上述函数将横向合并对象A和对象B。为了让它正常工作,每个对象必须拥有相同的行数,且要以相同的顺序排序。

添加行

要纵向合并两个数据框,请使用rbind()函数

total <- rbind(dataframeA, dataframeB)

两个数据框必须拥有相同的变量,不过他们的顺序不必一定相同。

如果dataframeA中拥有dataframeB中没有的变量,在合并它们之前需要做一些某种处理

  • 删除dataframeA中的多余变量

  • 在dataframeB重创建追加的变量并将其值设为NA

纵向联结通常用于想数据框中添加观测。

没有评论: