RL-PowerTracking-new

Go to file

fly6516 1fc489e188 feat(DOA_SAC_sim2real): 实现高级奖励机制并优化模型训练 - 新增奖励函数权重参数，可调节距离、动作、碰撞和边界惩罚 - 实现归一化距离奖励、动作幅度惩罚、碰撞惩罚和边界惩罚 - 更新模型训练配置，增加经验回放缓冲区大小、调整学习率等 - 添加多GPU支持和数据并行训练 - 优化日志记录和模型保存策略		2025-05-29 15:41:42 +08:00
.idea/inspectionProfiles	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
urdf	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
best_model.zip	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
DOA_SAC_sim2real.py	feat(DOA_SAC_sim2real): 实现高级奖励机制并优化模型训练	2025-05-29 15:41:42 +08:00
environment.yaml	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
jakaAPI.dll	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
jakaAPI.lib	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
jkrc.pyd	feat(urdf): 添加吸盘模型和测试用例	2025-05-27 15:16:30 +08:00
requirements.txt	build: 添加项目依赖文件 requirements.txt	2025-05-27 15:27:36 +08:00