RL-PowerTracking
- 创建项目结构和核心模块 - 实现机械手臂控制和目标跟踪功能 - 开发强化学习环境和训练脚本 - 添加文档和使用示例 - 设置日志记录和TensorBoard可视化 |
||
|---|---|---|
| docs | ||
| examples | ||
| models | ||
| src | ||
| tensorboard_logs | ||
| create_directories.py | ||
| README.md | ||
| requirements.txt | ||
| tensorboard_start.bat | ||
RL-PowerTracking
基于强化学习的电力目标跟踪系统
项目结构
src/- 核心代码docs/- 文档tests/- 测试用例examples/- 使用示例data/- 数据集models/- 模型保存目录tensorboard_logs/- TensorBoard日志
目录自动创建
为确保项目运行时所需目录存在,新增了create_directories.py脚本。在运行训练前,请先执行:
python create_directories.py
安装依赖
pip install -r requirements.txt
最新优化
- 环境注册问题已修复,自定义环境正确注册为
CartesianSpace-v0 - 训练速度优化:使用MlpPolicy、较大的batch_size=1024、use_sde=True提升CPU利用率
- 解决了向量化环境观测值解包问题
- 环境包装器嵌套顺序优化(Monitor包裹RecordEpisodeStatistics)