2025-03-12 08:31:10 +00:00
|
|
|
|
#-*- coding: utf-8 -*-
|
|
|
|
|
#使用Apriori算法挖掘菜品订单关联规则
|
|
|
|
|
from __future__ import print_function
|
|
|
|
|
import pandas as pd
|
|
|
|
|
from apriori import * #导入自行编写的apriori函数
|
2025-03-14 03:40:29 +00:00
|
|
|
|
import time # 导入time模块用于计时
|
2025-03-12 08:31:10 +00:00
|
|
|
|
|
2025-03-14 03:40:29 +00:00
|
|
|
|
inputfile = '../data/iris.csv'
|
2025-03-12 08:31:10 +00:00
|
|
|
|
outputfile = '../tmp/apriori_rules.xlsx' #结果文件,保留 .xlsx 格式
|
2025-03-14 03:40:29 +00:00
|
|
|
|
data = pd.read_csv(inputfile, header = None)
|
2025-03-12 08:31:10 +00:00
|
|
|
|
|
|
|
|
|
print(u'\n转换原始数据至0-1矩阵...')
|
|
|
|
|
ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #转换0-1矩阵的过渡函数
|
|
|
|
|
b = map(ct, data.iloc[:,:].values) #用map方式执行
|
|
|
|
|
data = pd.DataFrame(list(b)).fillna(0) #实现矩阵转换,空值用0填充
|
|
|
|
|
print(u'\n转换完毕。')
|
|
|
|
|
del b #删除中间变量b,节省内存
|
|
|
|
|
|
|
|
|
|
support = 0.2 #最小支持度
|
|
|
|
|
confidence = 0.5 #最小置信度
|
|
|
|
|
ms = '---' #连接符,默认'--',用来区分不同元素,如A--B。需要保证原始表格中不含有该字符
|
|
|
|
|
|
|
|
|
|
# 提醒用户需要安装 openpyxl 库以支持 .xlsx 格式
|
|
|
|
|
# 如果未安装,可以通过以下命令安装:pip install openpyxl
|
2025-03-14 03:40:29 +00:00
|
|
|
|
start_time = time.time() # 记录开始时间
|
|
|
|
|
result = find_rule(data, support, confidence, ms)
|
|
|
|
|
end_time = time.time() # 记录结束时间
|
|
|
|
|
print(f'\nApriori算法运行时间: {end_time - start_time} 秒')
|
|
|
|
|
|
|
|
|
|
result.to_excel(outputfile, engine='openpyxl') #保存结果,指定 engine='openpyxl'
|