AI-exp-2/setup_environment.md
fly6516 b1e90c4c9d feat(AI-exp-2): 实现图像分割与 SIFT 特征提取
- 添加 U-Net 模型实现图像分割功能- 实现 SIFT 特征提取算法
- 创建实验报告模板和环境配置指南
- 添加数据集下载脚本和目录结构设置脚本
- 实现模型训练和测试流程
2025-05-16 21:17:46 +08:00

71 lines
2.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 环境配置指南
## 安装依赖库
```bash
# 激活虚拟环境(如果使用)
.\.venv\Scripts\activate
# 安装核心依赖
pip install -r requirements.txt
```
## COCO数据集准备
> 重要请将COCO格式数据集组织为以下结构
```
dataset/
├── train/ # 存放训练集图像
├── valid/ # 存放验证集图像
├── test/ # 存放测试集图像
└── _annotations.coco.json # COCO格式标注文件需在每个子目录下
```
### 数据集获取建议
- 可从COCO官方数据集下载https://cocodataset.org/#download
- 或使用自定义标注数据需符合COCO格式规范
## 数据集准备
> 重要:请确保已将脑肿瘤数据集组织为以下结构:
```
data/
├── images/ # 存放原始图像(文件名需包含"_image"后缀)
└── masks/ # 存放对应掩码图像(文件名需包含"_mask"后缀)
```
### 数据集命名规范
1. 原始图像:`xxx_image.jpg`
2. 对应掩码:`xxx_mask.jpg`
3. 确保图像和掩码文件名除后缀外完全相同
### 数据集获取建议
- 可从Kaggle脑肿瘤数据集下载https://www.kaggle.com/datasets/pkdarabi/brain-tumor-image-dataset-semantic-segmentation
- 或使用自定义标注数据
## 数据准备指南
### 图像分割数据集
1. **Oxford-IIIT Pet Dataset** (推荐)
- 下载地址: https://www.robots.ox.ac.uk/~vgg/data/pets/
- 解压后包含两个主要目录:
- `images/` - 原始图像
- `annotations/trimaps/` - 对应的掩码图像
- 将图像复制到项目目录:
```bash
cp -r images/ ../AI-exp-2/data/images/
cp -r annotations/trimaps/ ../AI-exp-2/data/masks/
```
2. **自定义数据集**
- 准备至少20对图像和对应的二值掩码图像
- 图像命名需保持一致image001.jpg 和 image001_mask.jpg
### SIFT测试图像
1. 准备一张彩色测试图像JPG格式
2. 重命名为 `image.jpg`
3. 放置到 `data/` 目录下
## 目录结构验证
```bash
# 验证目录结构是否正确
python setup_directories.py