- 添加多个数据预处理示例脚本,包括离散化、去重、缺失值处理、插值、标准化等 - 新增 CheckNULL、Interpolation、Merge 等实用工具脚本 - 提供了不同的标准化方法示例,如标准差标准化、离差标准化、小数定标标准化
11 lines
328 B
Python
11 lines
328 B
Python
import pandas as pd
|
|
import numpy as np
|
|
inputfile = '5Preprocessing/1.xlsx' #销量数据路径
|
|
s = pd.read_excel(inputfile) #读入数据
|
|
print('数据输出为:\n',s)
|
|
#去除重复
|
|
data1 = s['x'].drop_duplicates()
|
|
print('数据输出为:\n',data1)
|
|
#缺失值中位数填补
|
|
data2=s['y'].fillna(s['y'].median())
|
|
print(data2) |