Pandas常用技巧有哪些

常用技巧一：数据读取和展示

使用Pandas读取和展示数据是数据分析的基础工作。Pandas提供了多种读取数据的函数，常用的有read_csv、read_excel和read_sql等。读取数据后，可以使用head、tail和sample等函数展示数据的前几行、后几行以及随机抽样的几行。

例如，可以使用以下代码读取名为data.csv的CSV文件，并展示前5行数据：


import pandas as pd

data = pd.read_csv('data.csv')
print(data.head(5))

常用技巧二：数据筛选和排序

在数据分析中，经常需要根据条件筛选数据或者按照某一列进行排序。Pandas提供了多种方法来实现数据筛选和排序的功能。

1. 数据筛选：可以使用DataFrame的布尔索引来筛选数据，通过指定条件来选择满足条件的行。例如，筛选出data中'Score'列大于等于90的行：


filtered_data = data[data['Score'] >= 90]
print(filtered_data)

2. 数据排序：可以使用sort_values函数对DataFrame进行排序。例如，按照'Score'列进行降序排序：


sorted_data = data.sort_values('Score', ascending=False)
print(sorted_data)

常用技巧三：数据聚合和统计

在数据分析中，经常需要对数据进行聚合和统计。Pandas提供了多种函数来实现这些功能，例如sum、mean、count和groupby等。

1. 数据聚合：可以使用groupby函数对数据进行分组，并对每个组进行聚合操作。例如，计算每个'Subject'的平均分数：


average_score_by_subject = data.groupby('Subject')['Score'].mean()
print(average_score_by_subject)

2. 数据统计：可以使用describe函数对数据进行统计描述。例如，计算数据的总体统计信息，包括均值、标准差、最小值、最大值等：


statistics = data.describe()
print(statistics)

常用技巧四：缺失值处理和数据转换

在数据分析中，经常会遇到数据中存在缺失值或者需要对数据进行转换的情况。Pandas提供了多种函数来处理缺失值和数据转换。

1. 缺失值处理：可以使用fillna函数对缺失值进行填充。例如，将数据中的缺失值替换为0：


filled_data = data.fillna(0)
print(filled_data)

2. 数据转换：可以使用map函数对数据进行转换或者使用apply函数对每个元素进行转换。例如，将数据中的'Score'列按照一定规则进行转换：


transformed_data = data['Score'].map(lambda x: x*2)
print(transformed_data)

微信分享二维码