- 添加多个数据预处理示例脚本,包括离散化、去重、缺失值处理、插值、标准化等 - 新增 CheckNULL、Interpolation、Merge 等实用工具脚本 - 提供了不同的标准化方法示例,如标准差标准化、离差标准化、小数定标标准化
13 lines
326 B
Python
13 lines
326 B
Python
#等频离散化
|
|
import pandas as pd
|
|
import numpy as np
|
|
num=[5,10,11,13,15,35,50,55,72,92,204,215]
|
|
k=4; #设置离散后的数据段为5
|
|
temp=[ i/k*100 for i in range(k+1)]
|
|
print(temp)
|
|
w=[ ]
|
|
for item in temp:
|
|
w.append(np.percentile(num,item))
|
|
w[0] = w[0]*(1-1e-10)
|
|
d2=pd.cut(num,w,labels=range(k))
|
|
print(d2.value_counts()) |