详解pandas.DataFrame.fillna()(填充缺失值)函数使用方法
Pandas.DataFrame.fillna()
是 Pandas 库中的一个函数,主要用于填充或替换 DataFrame 中的缺失值(即 NaN 值)。
具体如何使用呢?以下是一些基本步骤:
首先,我们需要确保已经安装了 pandas 库,如果没有,可以通过 pip 命令进行安装:
pip install pandas
接下来,我们来创建一个简单的 DataFrame 来演示如何使用fillna()
:
# 导入 pandas
import pandas as pd
# 创建一个带有 NaN 值的 DataFrame
df = pd.DataFrame({
'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8],
'C': [9, 10, 11, 12]
})
print(df)
# 输出如下:
# A B C
# 0 1.0 5.0 9
# 1 2.0 NaN 10
# 2 NaN NaN 11
# 3 4.0 8.0 12
现在我们可以使用 fillna()
函数来填充 NaN 值。这里有个例子说明如何使用具体的值来填充:
df.fillna(0)
# 输出如下:
# A B C
# 0 1.0 5.0 9
# 1 2.0 0.0 10
# 2 0.0 0.0 11
# 3 4.0 8.0 12
在上述代码中,所有的 NaN 值都被 0 替换。
你也可以使用前一个值或后一个值进行填充,如下所示:
# 使用前一个值进行填充
df.fillna(method='ffill')
# 使用后一个值进行填充
df.fillna(method='bfill')
另外,fillna()
函数也允许你使用列的平均值、中位数或众数等进行填充,例如:
# 使用平均值填充
df.fillna(df.mean())
以上就是Pandas.DataFrame.fillna()
函数的基本使用方法,希望对你有所帮助!
(相邻兄弟选择器通用兄弟选择器) 层次选择器包括哪些 CSS 中的层次选择器:选择父元素子元素或同级元素 全网首发(图文详解1)
(readlines方法) Python 逐行读取文件(readline、readlines)函数使用方法 Python文件读取:readline vs readlines 全网首发(图文详解1)