|
28d60018af
|
fix(1-1.py):优化日志解析和空 RDD处理
- 重构日志解析逻辑,提高代码可读性
- 改进空 RDD检查方法,使用 count() 替代 isEmpty()
- 优化输出格式,使用格式化字符串替代 f-string
|
2025-04-14 01:51:33 +08:00 |
|
|
c48a91f11e
|
refactor(1-1.py): 重构日志分析代码
- 重新编写日志解析逻辑,使用正则表达式匹配日志行
- 添加错误处理和日志文件为空时的处理逻辑- 优化 Top 10 最常访问的端点统计代码- 使用 f-string 改进代码可读性
- 添加 SparkContext 初始化和停止逻辑
|
2025-04-14 01:49:05 +08:00 |
|
|
329b28dc26
|
分析:新增失败URL分析功能- 从日志中筛选出响应码非200的请求
- 统计每个URL的失败次数
- 获取失败次数最多的前10个URL
-打印结果
|
2025-04-14 01:46:24 +08:00 |
|