(pivot函数) pandas应用实例之pivot函数详解
Pandas 的 pivot
函数通常用于重新组织数据,其典型应用是将长格式的数据转换为宽格式的数据。下面通过一个实例详细解释如何使用 pivot
函数,并给出相应的代码和注释说明。
实例数据:
假设我们有以下的销售数据,包含日期、产品和销售额三列:
日期 | 产品 | 销售额 |
---|---|---|
2024-05-01 | A | 100 |
2024-05-01 | B | 200 |
2024-05-02 | A | 150 |
2024-05-02 | B | 300 |
如果我们想分析每天各产品的销售情况,就可以用 pivot
函数将这个长格式的数据转换为宽格式数据。
解决步骤:
1. 导入Pandas库和创建数据集
import pandas as pd
# 创建数据
data = {
'日期': ['2024-05-01', '2024-05-01', '2024-05-02', '2024-05-02'],
'产品': ['A', 'B', 'A', 'B'],
'销售额': [100, 200, 150, 300]
}
# 创建DataFrame
df = pd.DataFrame(data)
2. 使用pivot函数
# 使用pivot函数重组数据
pivot_df = df.pivot(index='日期', columns='产品', values='销售额')
3. 查看结果
转换后的宽格式数据的每一行对应一个日期,每一列对应一个产品,数据单元格是销售额。
完整代码示例:
import pandas as pd
# 创建数据
data = {
'日期': ['2024-05-01', '2024-05-01', '2024-05-02', '2024-05-02'],
'产品': ['A', 'B', 'A', 'B'],
'销售额': [100, 200, 150, 300]
}
# 创建DataFrame
df = pd.DataFrame(data)
# 使用pivot函数重组数据
pivot_df = df.pivot(index='日期', columns='产品', values='销售额')
# 打印结果
print(pivot_df)
执行上述代码后,会得到如下的宽格式DataFrame:
产品 A B
日期
2024-05-01 100 200
2024-05-02 150 300
注意事项:
- 在使用
pivot
函数时,我们必须确保指定的index
和columns
参数组合是唯一的,否则pivot
操作将会失败,抛出ValueError
。 - 如果存在重复的组合,并且我们仍然需要重塑数据,通常会使用
pivot_table
函数,它可以聚合重复项。 - 在实际使用中,
pivot
是一个常用的数据预处理步骤,帮助我们进行更加便捷的数据分析和可视化。
(哔哩哔哩 mac) bilibili哔哩哔哩客户端 v7.60.0 Mac 官方正式苹果电脑版 如何安装 bilibili 客户端 全网首发(图文详解1)
(js定义数组) JavaScript定义数组的三种方法(new Array(),new Array(‘x’,’y’) JavaScript 数组定义方式 全网首发(图文详解1)