BD-exp-9
- 重新设计代码结构,添加函数以提高可读性和可维护性 - 增加对 stopwords 的处理,提高索引准确性 - 使用 csv 模块解析 CSV 数据,提高数据处理能力 - 优化文本分词和数据提取逻辑,增强数据处理效率 - 构建倒排索引并保存到 HDFS,实现数据索引功能 |
||
---|---|---|
1-1.py | ||
2-1.py | ||
3-1.py |
- 重新设计代码结构,添加函数以提高可读性和可维护性 - 增加对 stopwords 的处理,提高索引准确性 - 使用 csv 模块解析 CSV 数据,提高数据处理能力 - 优化文本分词和数据提取逻辑,增强数据处理效率 - 构建倒排索引并保存到 HDFS,实现数据索引功能 |
||
---|---|---|
1-1.py | ||
2-1.py | ||
3-1.py |