AI-exp-2/setup_environment.md

71 lines
2.1 KiB
Markdown
Raw Normal View History

# 环境配置指南
## 安装依赖库
```bash
# 激活虚拟环境(如果使用)
.\.venv\Scripts\activate
# 安装核心依赖
pip install -r requirements.txt
```
## COCO数据集准备
> 重要请将COCO格式数据集组织为以下结构
```
dataset/
├── train/ # 存放训练集图像
├── valid/ # 存放验证集图像
├── test/ # 存放测试集图像
└── _annotations.coco.json # COCO格式标注文件需在每个子目录下
```
### 数据集获取建议
- 可从COCO官方数据集下载https://cocodataset.org/#download
- 或使用自定义标注数据需符合COCO格式规范
## 数据集准备
> 重要:请确保已将脑肿瘤数据集组织为以下结构:
```
data/
├── images/ # 存放原始图像(文件名需包含"_image"后缀)
└── masks/ # 存放对应掩码图像(文件名需包含"_mask"后缀)
```
### 数据集命名规范
1. 原始图像:`xxx_image.jpg`
2. 对应掩码:`xxx_mask.jpg`
3. 确保图像和掩码文件名除后缀外完全相同
### 数据集获取建议
- 可从Kaggle脑肿瘤数据集下载https://www.kaggle.com/datasets/pkdarabi/brain-tumor-image-dataset-semantic-segmentation
- 或使用自定义标注数据
## 数据准备指南
### 图像分割数据集
1. **Oxford-IIIT Pet Dataset** (推荐)
- 下载地址: https://www.robots.ox.ac.uk/~vgg/data/pets/
- 解压后包含两个主要目录:
- `images/` - 原始图像
- `annotations/trimaps/` - 对应的掩码图像
- 将图像复制到项目目录:
```bash
cp -r images/ ../AI-exp-2/data/images/
cp -r annotations/trimaps/ ../AI-exp-2/data/masks/
```
2. **自定义数据集**
- 准备至少20对图像和对应的二值掩码图像
- 图像命名需保持一致image001.jpg 和 image001_mask.jpg
### SIFT测试图像
1. 准备一张彩色测试图像JPG格式
2. 重命名为 `image.jpg`
3. 放置到 `data/` 目录下
## 目录结构验证
```bash
# 验证目录结构是否正确
python setup_directories.py