1、Python Groupby() 的定义

Python 中的 groupby() 函数是 pandas 库中的一个函数,它可以将数据按照指定的键进行分组。它的定义如下:

def groupby(self, by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False):
Python

2、Python Groupby() 的参数

Python 中的 groupby() 函数有以下参数:

by:表示按照哪一列或者多列数据进行分组;

axis:表示按照行还是列来分组,0 表示按照行,1 表示按照列;

level:表示层次化索引时,按照哪一层级来分组;

as_index:表示是否把分组后的键作为索引,默认为 True;

sort:表示是否按照分组的键对分组后的数据进行排序,默认为 True;

group_keys:表示是否把分组的键作为结果中的一列,默认为 True;

squeeze:表示是否对结果中的数据进行降维,默认为 False;

observed:表示是否只计算已经出现的组合,默认为 False。

3、Python Groupby() 的用法

Python 中的 groupby() 函数的用法如下:

# 导入pandas库
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)})
# 对DataFrame进行分组
df.groupby('A').sum()
# 按照多列进行分组
df.groupby(['A','B']).sum()
Python

上面的代码中,我们首先创建了一个 DataFrame,然后使用 groupby() 函数对 DataFrame 进行分组,指定分组的键为 A,最后使用 sum() 函数计算分组后的总和。我们也可以按照多列数据进行分组,指定分组的键为 A 和 B,最后使用 sum() 函数计算分组后的总和。