Preprocessing
title: Preprocessing tags:
Scikit-Learn
机器学习
categories:
机器学习
Imputer
Imputer用于完成缺失值的插补变换器。
定义
class sklearn.preprocessing.Imputer(missing_values=’NaN’, strategy=’mean’, axis=0, verbose=0, copy=True)
参数
missing_valuesinteger or
NaN, optional (default=”NaN”)缺失值的占位符
所有缺失值都会被补全
对于编码为
np.nan的缺失值,使用字符串 “NaN”
strategystring, optional (
default=”mean”)补全策略
取值
meanmedianmost_frequent
axisinteger, optional (
default=0)取值
0: 列 (columns)1: 行 (rows)
verboseinteger, optional (default=0)
copyboolean, optional (default=True)
取值
True: 创建数据集 X 的副本False: 就地修改
以下情况,总是创建副本
如果 X 不是
floating类型的数组如果 X 是稀疏的,并且缺失值为
0如果
axis=0,并且 X 被编码为 CSR 矩阵如果
axis=1,并且 X 被编码为 CSC 矩阵
属性
statistics_array of shape (n_features,)
方法
fit(X, y=None)fit_transform(X, y=None, **fit_params)transform(X)
参考
最后更新于
这有帮助吗?