AI-exp-4/docs/experiment_report.md

63 lines
2.2 KiB
Markdown
Raw Permalink Normal View History

# 实验报告NeRF算法和CNN图像识别算法
## 一、算法基本思想
### 1. NeRF算法
神经辐射场NeRF是一种基于神经网络的3D场景表示方法其核心思想是将场景建模为一个连续的5D函数该函数输入空间坐标(x,y,z)和视角方向(θ,φ),输出该点的颜色和密度。通过体渲染技术,可以合成任意新视角下的图像。
#### 数据集格式要求
NeRF数据集应包含以下内容
- images/ 目录包含多视角图像PNG格式
- poses_bounds.npy 文件:包含相机位姿信息
- transforms.json 文件:包含数据集元信息
主要特点:
- 使用位置编码将坐标信息映射到高维空间
- 分层采样策略提高渲染效率
- 体密度和颜色的联合优化
### 2. CNN图像识别算法
卷积神经网络CNN是一种专门处理具有类似网格结构数据的深度学习模型。通过卷积层自动提取图像的局部特征配合池化层降低空间维度最终通过全连接层实现分类任务。
主要特点:
- 局部感受野捕捉空间特征
- 权重共享减少参数数量
- 多层架构实现特征层级提取
## 二、源码
完整代码见nerf/nerf.py和cnn/cnn.py文件
## 三、算法分析
### 时间复杂度
| 算法 | 训练阶段 | 推理阶段 |
|------|---------|---------|
| NeRF | O(N^3) | O(N^2) |
| CNN | O(W*H*C)| O(W*H*C)|
其中N为场景分辨率W,H为图像宽高C为通道数
### 空间复杂度
| 算法 | 模型参数 | 显存占用 |
|------|---------|---------|
| NeRF | ~50MB | ~2GB |
| CNN | ~10MB | ~500MB |
## 四、实验运行结果图
### NeRF训练结果
- 训练损失变化:
Epoch {epoch} completed. Average Loss: {avg_loss:.4f}
![示例重建结果](../results/nerf/epoch_{epoch}_step_{i}.png)
![原始图像](../results/nerf/true_{epoch}_step_{i}.png)
### CNN测试结果
- 测试准确率: {{accuracy}}%
![示例预测结果](../results/cnn/sample_predictions.png)
## 五、总结
本实验实现了NeRF三维重建算法和CNN图像分类算法验证了两种算法的基本原理和应用效果。实验结果表明NeRF能够实现高质量的三维场景重建而CNN在二维图像分类任务中表现出优异的性能。