BD-exp-8
Go to file
fly6516 1512ab8eeb feat: 实现日志解析和 404 错误分析
- 添加日志解析函数,使用正则表达式解析 Apache 日志
- 通过 Spark 读取和处理日志数据
- 实现 404 错误日志的过滤和统计- 获取并打印前 25 个产生 404错误最多的主机
2025-04-14 03:40:00 +08:00
.idea feat: init files 2025-04-13 16:57:29 +00:00
1-1.py fix(1-1.py):优化日志解析和空 RDD处理 2025-04-14 01:51:33 +08:00
1-2.py feat:统计 HDFS 日志中的唯一主机数量 2025-04-14 01:58:03 +08:00
1-3.py feat:统计每天的独立访客数 2025-04-14 02:12:36 +08:00
1-4.py plot(dailyHosts): 绘制每日唯一主机数量图表 2025-04-14 02:19:26 +08:00
1-5.py feat(1-5): 计算每天平均每个主机的请求数 2025-04-14 02:27:07 +08:00
1-6.py feat: 添加 1-6.py 以计算每日平均请求量并绘图 2025-04-14 02:31:43 +08:00
2-1.py feat: 添加日志解析和404 错误统计功能 2025-04-14 03:29:09 +08:00
2-2.py feat: 添加日志解析和404 错误统计功能 2025-04-14 03:35:39 +08:00
2-3.py feat: 实现日志解析和 404 错误分析 2025-04-14 03:40:00 +08:00
log_analysis_step2.py feat(log_analysis_step2.py): 添加日志分析功能 2025-04-14 01:10:45 +08:00
main.py feat: init files 2025-04-13 16:57:29 +00:00
pretest1.py test(pretest1.py): 添加日志解析测试功能 2025-04-14 01:00:04 +08:00
test_helper.py feat: init files 2025-04-13 16:57:29 +00:00