Commit Graph

2 Commits

Author SHA1 Message Date
6e80f59ea1 style(5-1): 优化 print 语句格式
-将 print 语句中的格式化字符串改为使用 format 方法
- 提高了代码的可读性和兼容性
2025-04-20 02:49:41 +08:00
9921a965ae feat(5-1.py): 实现可扩展实体匹配算法
- 创建 SparkContext 和 SQLContext
- 读取和解析 Amazon 和 Google 数据集
- 实现数据分词、TF-IDF 计算、余弦相似度计算等功能- 创建和使用广播变量提高计算效率
- 优化实体匹配算法以处理大规模数据集
2025-04-20 02:47:48 +08:00