BD-exp-8
Go to file
fly6516 e64886745b feat: 添加日志解析和404 错误统计功能
- 新增日志解析函数 parse_log_line,用于解析 Apache 日志
- 添加过滤 404 错误的函数 filter_404
- 实现从 HDFS 读取日志、解析、过滤和统计 404 错误的完整流程- 打印 404 错误记录的数量
2025-04-14 02:39:43 +08:00
.idea feat: init files 2025-04-13 16:57:29 +00:00
1-1.py fix(1-1.py):优化日志解析和空 RDD处理 2025-04-14 01:51:33 +08:00
1-2.py feat:统计 HDFS 日志中的唯一主机数量 2025-04-14 01:58:03 +08:00
1-3.py feat:统计每天的独立访客数 2025-04-14 02:12:36 +08:00
1-4.py plot(dailyHosts): 绘制每日唯一主机数量图表 2025-04-14 02:19:26 +08:00
1-5.py feat(1-5): 计算每天平均每个主机的请求数 2025-04-14 02:27:07 +08:00
1-6.py feat: 添加 1-6.py 以计算每日平均请求量并绘图 2025-04-14 02:31:43 +08:00
2-1.py feat: 添加日志解析和404 错误统计功能 2025-04-14 02:39:43 +08:00
log_analysis_step2.py feat(log_analysis_step2.py): 添加日志分析功能 2025-04-14 01:10:45 +08:00
main.py feat: init files 2025-04-13 16:57:29 +00:00
pretest1.py test(pretest1.py): 添加日志解析测试功能 2025-04-14 01:00:04 +08:00
test_helper.py feat: init files 2025-04-13 16:57:29 +00:00