数据处理过程中,分组处理是常见的操作。分组之后,对每组数据进一步施加约束,找出所需数据,在sql中可用 select ...... from ......group by ...... having......来实现。在pandas中可用以下方式
数据处理过程中,分组处理是常见的操作。分组之后,对每组数据进一步施加约束,找出所需数据,在sql中可用 select ...... from ......group by ...... having......来实现。在pandas中可用以下方式来达到相同的目的。
1. groupby组合apply
如果想把结果以“SQL”格式显示,只需要将groupby中的关键字参数as_index设为False即可。
2. groupby组合filter
3. 两种方法的区别
groupby中的filter,其作用对象是每个分组,返回结果也是以分组为整体(仔细领会!)。apply,作用对象是每个分组中的每行,返回结果是每个分组中每一个符合apply中函数约束的行。