- 重新编写日志解析逻辑,使用正则表达式匹配日志行 - 添加错误处理和日志文件为空时的处理逻辑- 优化 Top 10 最常访问的端点统计代码- 使用 f-string 改进代码可读性 - 添加 SparkContext 初始化和停止逻辑
- 统计每个URL的失败次数 - 获取失败次数最多的前10个URL -打印结果