DM-exp-1/4-2-2.py
fly6516 3f2ae8adf5 feat(preprocessing): 添加数据预处理示例脚本
- 添加多个数据预处理示例脚本,包括离散化、去重、缺失值处理、插值、标准化等
- 新增 CheckNULL、Interpolation、Merge 等实用工具脚本
- 提供了不同的标准化方法示例,如标准差标准化、离差标准化、小数定标标准化
2025-03-30 02:55:48 +08:00

13 lines
326 B
Python

#等频离散化
import pandas as pd
import numpy as np
num=[5,10,11,13,15,35,50,55,72,92,204,215]
k=4; #设置离散后的数据段为5
temp=[ i/k*100 for i in range(k+1)]
print(temp)
w=[ ]
for item in temp:
w.append(np.percentile(num,item))
w[0] = w[0]*(1-1e-10)
d2=pd.cut(num,w,labels=range(k))
print(d2.value_counts())