BD-exp-8
- 添加 Spark 代码以读取 HDFS 上的日志文件 - 实现日志行解析函数以提取 IP 地址 - 使用 RDD操作过滤并计算唯一主机数量- 打印结果并停止 SparkContext |
||
---|---|---|
.idea | ||
1-1.py | ||
1-2.py | ||
log_analysis_step2.py | ||
main.py | ||
pretest1.py | ||
test_helper.py |
- 添加 Spark 代码以读取 HDFS 上的日志文件 - 实现日志行解析函数以提取 IP 地址 - 使用 RDD操作过滤并计算唯一主机数量- 打印结果并停止 SparkContext |
||
---|---|---|
.idea | ||
1-1.py | ||
1-2.py | ||
log_analysis_step2.py | ||
main.py | ||
pretest1.py | ||
test_helper.py |