BD-exp-9
Go to file
fly6516 9921a965ae feat(5-1.py): 实现可扩展实体匹配算法
- 创建 SparkContext 和 SQLContext
- 读取和解析 Amazon 和 Google 数据集
- 实现数据分词、TF-IDF 计算、余弦相似度计算等功能- 创建和使用广播变量提高计算效率
- 优化实体匹配算法以处理大规模数据集
2025-04-20 02:47:48 +08:00
1-1.py init code 2025-04-16 01:40:52 +00:00
2-1.py init code 2025-04-16 01:40:52 +00:00
3-1.py feat(3-1.py): 实现 TF-IDF 权重计算并优化代码结构 2025-04-16 10:08:50 +08:00
4-1.py feat(4-1): 重构代码以实现 Amazon 和 Google 数据集的余弦相似度计算 2025-04-20 02:38:15 +08:00
5-1.py feat(5-1.py): 实现可扩展实体匹配算法 2025-04-20 02:47:48 +08:00