- 添加多个数据预处理示例脚本,包括离散化、去重、缺失值处理、插值、标准化等 - 新增 CheckNULL、Interpolation、Merge 等实用工具脚本 - 提供了不同的标准化方法示例,如标准差标准化、离差标准化、小数定标标准化
20 lines
581 B
Python
20 lines
581 B
Python
import pandas as pd
|
|
model=pd.read_excel("5Preprocessing/model.xls")
|
|
def Standard(data):
|
|
data=(data-data.mean())/data.std()
|
|
return data
|
|
S=Standard(model)
|
|
print("标准化后的数据为:",'\n',S.head())
|
|
|
|
def MinMaxScale(data):
|
|
data=(data-data.min())/(data.max()-data.min())
|
|
return data
|
|
M=MinMaxScale(model)
|
|
print("离差标准化后的数据为:",'\n',S.head())
|
|
|
|
import numpy as np
|
|
def DecimalScaler(data):
|
|
data=data/10**np.ceil(np.log10(data.abs().max()))
|
|
return data
|
|
D=DecimalScaler(model)
|
|
print("小数定标差标准化的数据为:",'\n',D.head()) |