-移除了不必要的环境变量设置和测试代码 - 新增 data_prepare模块用于初始化 RDD - 添加了计算电影平均评分和过滤高评分电影的功能 - 优化了代码结构,提高了可读性和可维护性
- 新增 basic_re.py 文件,实现了一个简单的 Spark 应用程序 - 该程序从 HDFS 读取电影评分数据,进行基本的数据处理和统计 - 演示了如何使用 Spark RDD 进行数据转换和操作 - 验证了数据排序和比较的功能