RL-PowerTracking
- 创建项目结构和核心模块 - 实现机械手臂控制和目标跟踪功能 - 开发强化学习环境和训练脚本 - 添加文档和使用示例 - 设置日志记录和TensorBoard可视化 |
||
---|---|---|
docs | ||
examples | ||
models | ||
src | ||
tensorboard_logs | ||
create_directories.py | ||
README.md | ||
requirements.txt | ||
tensorboard_start.bat |
RL-PowerTracking
基于强化学习的电力目标跟踪系统
项目结构
src/
- 核心代码docs/
- 文档tests/
- 测试用例examples/
- 使用示例data/
- 数据集models/
- 模型保存目录tensorboard_logs/
- TensorBoard日志
目录自动创建
为确保项目运行时所需目录存在,新增了create_directories.py
脚本。在运行训练前,请先执行:
python create_directories.py
安装依赖
pip install -r requirements.txt
最新优化
- 环境注册问题已修复,自定义环境正确注册为
CartesianSpace-v0
- 训练速度优化:使用MlpPolicy、较大的batch_size=1024、use_sde=True提升CPU利用率
- 解决了向量化环境观测值解包问题
- 环境包装器嵌套顺序优化(Monitor包裹RecordEpisodeStatistics)