Go to file
fly6516 1fc489e188 feat(DOA_SAC_sim2real): 实现高级奖励机制并优化模型训练
- 新增奖励函数权重参数,可调节距离、动作、碰撞和边界惩罚
- 实现归一化距离奖励、动作幅度惩罚、碰撞惩罚和边界惩罚
- 更新模型训练配置,增加经验回放缓冲区大小、调整学习率等
- 添加多GPU支持和数据并行训练
- 优化日志记录和模型保存策略
2025-05-29 15:41:42 +08:00
.idea/inspectionProfiles feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
urdf feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
best_model.zip feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
DOA_SAC_sim2real.py feat(DOA_SAC_sim2real): 实现高级奖励机制并优化模型训练 2025-05-29 15:41:42 +08:00
environment.yaml feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
jakaAPI.dll feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
jakaAPI.lib feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
jkrc.pyd feat(urdf): 添加吸盘模型和测试用例 2025-05-27 15:16:30 +08:00
requirements.txt build: 添加项目依赖文件 requirements.txt 2025-05-27 15:27:36 +08:00