Commit Graph

2 Commits

Author SHA1 Message Date
5770bc266e feat(6-1): 实现 TF-IDF 和余弦相似度计算
- 添加分词和数据解析功能
- 实现逆文档频率 (IDF) 计算
- 计算 TF-IDF 权重
- 添加向量范数计算
- 实现倒排索引和快速余弦相似度计算
- 处理完整数据集并计算相似度
2025-04-20 03:19:24 +08:00
6f703860a6 feat(6-1.py): 新增文本分析功能
- 创建 SparkContext 和相关 RDD
- 计算真阳性相似度和累加器
- 定义精度、召回率和 F 度量的计算方法
- 生成阈值列表并计算对应指标值
- 绘制精度、召回率和 F 度量的折线图
- 停止 SparkContext
2025-04-20 03:16:29 +08:00