我是R的新手,我正在尝试使用聚合来对数据框,每个主题以及我的数据集中的每个指标执行一些时间序列整形.这很好用,但我发现结果不是一种非常容易使用的格式.我希望能够将结果转换
以虹膜数据集为例:
# Split into two data frames, one for metrics, the other for grouping iris_species = subset(iris, select=Species) iris_metrics = subset(iris, select=-Species) # Compute diff for each metric with respect to its species iris_diff = aggregate(iris_metrics, iris_species, diff)
我只是使用diff来说明我有一个塑造时间序列的函数,因此我得到一个可能不同长度的时间序列作为结果,绝对不是单个聚合值(例如,均值).
我想转换结果,这似乎是一个矩阵,它具有列表值单元格到原始的“平面”数据帧.
我很好奇如何使用聚合的结果来管理这个问题,但是我可以使用在plyr或reshape中执行所有操作的解决方案.
您可能知道,聚合一次只能在一列上运行.预期单个值,如果返回长度不同于1的向量,则会发生奇怪的事情.您可以将其拆分以获取数据(行数少于虹膜中的行数)并将其重新组合在一起:
b <- by(iris_metrics, iris_species, FUN=function(x) diff(as.matrix(x))) do.call(rbind, lapply(names(b), function(x) data.frame(Species=x, b[[x]])))
使用diff(as.matrix),因为这样做你想要的矩阵(但不是数据帧).关键是该函数返回的行数与虹膜中每个Species中的行数不同.