BD-exp-8
Go to file
fly6516 ede4f6c21f feat:绘制每日 404 响应代码记录的折线图
- 新增2-6.py 文件,实现日志解析和统计功能
- 使用 Spark 集群处理大规模日志数据
- 提取每日404 错误次数并使用 Matplotlib 绘制折线图
- 通过正则表达式解析日志,过滤出404 状态码的日志
- 按日期统计404 错误次数,并排序
- 最后展示折线图,直观显示每日 404 错误的变化趋势
2025-04-14 03:51:05 +08:00
.idea feat: init files 2025-04-13 16:57:29 +00:00
1-1.py fix(1-1.py):优化日志解析和空 RDD处理 2025-04-14 01:51:33 +08:00
1-2.py feat:统计 HDFS 日志中的唯一主机数量 2025-04-14 01:58:03 +08:00
1-3.py feat:统计每天的独立访客数 2025-04-14 02:12:36 +08:00
1-4.py plot(dailyHosts): 绘制每日唯一主机数量图表 2025-04-14 02:19:26 +08:00
1-5.py feat(1-5): 计算每天平均每个主机的请求数 2025-04-14 02:27:07 +08:00
1-6.py feat: 添加 1-6.py 以计算每日平均请求量并绘图 2025-04-14 02:31:43 +08:00
2-1.py feat: 添加日志解析和404 错误统计功能 2025-04-14 03:29:09 +08:00
2-2.py feat: 添加日志解析和404 错误统计功能 2025-04-14 03:35:39 +08:00
2-3.py refactor(2-3.py): 重构日志分析代码并提取 404 错误最多的端点 2025-04-14 03:46:02 +08:00
2-4.py refactor(2-3.py): 重构日志分析代码并提取 404 错误最多的端点 2025-04-14 03:46:02 +08:00
2-5.py feat:统计每日 404 错误记录数量- 新增 2-5.py 文件,实现 Apache 日志解析和 404 错误统计功能 2025-04-14 03:49:08 +08:00
2-6.py feat:绘制每日 404 响应代码记录的折线图 2025-04-14 03:51:05 +08:00
log_analysis_step2.py feat(log_analysis_step2.py): 添加日志分析功能 2025-04-14 01:10:45 +08:00
main.py feat: init files 2025-04-13 16:57:29 +00:00
pretest1.py test(pretest1.py): 添加日志解析测试功能 2025-04-14 01:00:04 +08:00
test_helper.py feat: init files 2025-04-13 16:57:29 +00:00