RL-PowerTracking/README.md

# RL-PowerTracking

基于强化学习的电力目标跟踪系统

## 项目结构
- `src/` - 核心代码
- `docs/` - 文档
- `tests/` - 测试用例
- `examples/` - 使用示例
- `data/` - 数据集
- `models/` - 模型保存目录
- `tensorboard_logs/` - TensorBoard日志

## 目录自动创建
为确保项目运行时所需目录存在，新增了`create_directories.py`脚本。在运行训练前，请先执行：
```bash
python create_directories.py
```

## 安装依赖
```bash
pip install -r requirements.txt
```

## 最新优化
1. 环境注册问题已修复，自定义环境正确注册为`CartesianSpace-v0`
2. 训练速度优化：使用MlpPolicy、较大的batch_size=1024、use_sde=True提升CPU利用率
3. 解决了向量化环境观测值解包问题
4. 环境包装器嵌套顺序优化（Monitor包裹RecordEpisodeStatistics）
-												feat: 初始化RL-PowerTracking项目

- 创建项目结构和核心模块
- 实现机械手臂控制和目标跟踪功能
- 开发强化学习环境和训练脚本
- 添加文档和使用示例
- 设置日志记录和TensorBoard可视化

											
										
										
											2025-05-25 11:25:02 +00:00
+								# RL-PowerTracking
 								基于强化学习的电力目标跟踪系统
 								## 项目结构
 								- `src/` - 核心代码
 								- `docs/` - 文档
 								- `tests/` - 测试用例
 								- `examples/` - 使用示例
 								- `data/` - 数据集
 								- `models/` - 模型保存目录
 								- `tensorboard_logs/` - TensorBoard日志
 								## 目录自动创建
 								为确保项目运行时所需目录存在，新增了`create_directories.py`脚本。在运行训练前，请先执行：
 								```bash
 								python create_directories.py
 								```
 								## 安装依赖
 								```bash
 								pip install -r requirements.txt
 								```
 								## 最新优化
 . 环境注册问题已修复，自定义环境正确注册为`CartesianSpace-v0`
 . 训练速度优化：使用MlpPolicy、较大的batch_size=1024、use_sde=True提升CPU利用率
 . 解决了向量化环境观测值解包问题
 . 环境包装器嵌套顺序优化（Monitor包裹RecordEpisodeStatistics）