python大数据框架 pandas添加列新数据列方法大全分享
在Pandas中,要添加新列到DataFrame中,你可以使用多种方法。下面是一些常用的方法和详细的步骤说明:
方法一:使用索引操作符([])添加新列
步骤:
- 创建一个DataFrame对象。
- 使用索引操作符([])并指定要添加的列名,然后为该列分配一个Series对象或一个列表。
- 新列将被添加到DataFrame中。
示例代码:
import pandas as pd
# 创建一个DataFrame对象
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 添加新列
df['City'] = ['New York', 'London', 'Paris']
# 打印DataFrame
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 London
2 Charlie 35 Paris
方法二:使用assign()方法添加新列
步骤:
- 创建一个DataFrame对象。
- 使用assign()方法并指定新列的名称和值,然后将其分配给一个变量。
- assign()方法返回一个新的DataFrame对象,其中包含新添加的列。
示例代码:
import pandas as pd
# 创建一个DataFrame对象
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 使用assign()方法添加新列
df_new = df.assign(City=['New York', 'London', 'Paris'])
# 打印新的DataFrame
print(df_new)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 London
2 Charlie 35 Paris
方法三:使用insert()方法插入新列
步骤:
- 创建一个DataFrame对象。
- 使用insert()方法并指定要插入的列的位置(索引)、列名和值。
- 新列将被插入到指定的位置。
示例代码:
import pandas as pd
# 创建一个DataFrame对象
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 使用insert()方法插入新列
df.insert(1, 'City', ['New York', 'London', 'Paris'])
# 打印DataFrame
print(df)
输出:
Name City Age
0 Alice New York 25
1 Bob London 30
2 Charlie Paris 35
方法四:使用assign()方法和lambda函数添加新列
步骤:
- 创建一个DataFrame对象。
- 使用assign()方法,并通过lambda函数计算新列的值,然后将其分配给一个变量。
- assign()方法返回一个新的DataFrame对象,其中包含新添加的列。
示例代码:
import pandas as pd
# 创建一个DataFrame对象
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 使用assign()方法和lambda函数添加新列
df_new = df.assign(Adult=lambda x: x['Age'] >= 18)
# 打印新的DataFrame
print(df_new)
输出:
Name Age Adult
0 Alice 25 True
1 Bob 30 True
2 Charlie 35 True
这些是在Pandas中添加新列的一些常用方法。你可以根据具体情况选择最适合你的方法。记住,Pandas提供了许多灵活的功能来处理数据框,使你能够轻松地添加、修改和删除列。