当前位置 : 主页 > 手机开发 > 其它 >

展平/非规范化R聚合函数的结果

来源:互联网 收集:自由互联 发布时间:2021-06-22
我是R的新手,我正在尝试使用聚合来对数据框,每个主题以及我的数据集中的每个指标执行一些时间序列整形.这很好用,但我发现结果不是一种非常容易使用的格式.我希望能够将结果转换
我是R的新手,我正在尝试使用聚合来对数据框,每个主题以及我的数据集中的每个指标执行一些时间序列整形.这很好用,但我发现结果不是一种非常容易使用的格式.我希望能够将结果转换回与原始数据帧相同的格式.

以虹膜数据集为例:

# Split into two data frames, one for metrics, the other for grouping
iris_species = subset(iris, select=Species)
iris_metrics = subset(iris, select=-Species)
# Compute diff for each metric with respect to its species
iris_diff = aggregate(iris_metrics, iris_species, diff)

我只是使用diff来说明我有一个塑造时间序列的函数,因此我得到一个可能不同长度的时间序列作为结果,绝对不是单个聚合值(例如,均值).

我想转换结果,这似乎是一个矩阵,它具有列表值单元格到原始的“平面”数据帧.

我很好奇如何使用聚合的结果来管理这个问题,但是我可以使用在plyr或reshape中执行所有操作的解决方案.

您可能知道,聚合一次只能在一列上运行.预期单个值,如果返回长度不同于1的向量,则会发生奇怪的事情.

您可以将其拆分以获取数据(行数少于虹膜中的行数)并将其重新组合在一起:

b <- by(iris_metrics, iris_species, FUN=function(x) diff(as.matrix(x)))
do.call(rbind, lapply(names(b), function(x) data.frame(Species=x, b[[x]])))

使用diff(as.matrix),因为这样做你想要的矩阵(但不是数据帧).关键是该函数返回的行数与虹膜中每个Species中的行数不同.

网友评论