Commit Graph

10 Commits

Author SHA1 Message Date
8381839069 feat: upload best_model.zip 2025-05-29 23:40:48 +08:00
1fc489e188 feat(DOA_SAC_sim2real): 实现高级奖励机制并优化模型训练
- 新增奖励函数权重参数,可调节距离、动作、碰撞和边界惩罚
- 实现归一化距离奖励、动作幅度惩罚、碰撞惩罚和边界惩罚
- 更新模型训练配置,增加经验回放缓冲区大小、调整学习率等
- 添加多GPU支持和数据并行训练
- 优化日志记录和模型保存策略
2025-05-29 15:41:42 +08:00
686164f670 feat(DOA_SAC_sim2real): 增加周期性模型检查点回调并优化路径配置- 动态路径配置:为硬件模块(如jkrc)实现动态路径配置,确保在不同环境中均可正确加载。
- 观测空间修改:调整观测空间为38维。
- 回调增强:添加 PeriodicModelCheckpointCallback,用于定期保存训练过程中的模型检查点。
- 日志与保存:修改日志目录和模型保存逻辑,使其更加清晰和灵活。
2025-05-28 21:42:37 +08:00
Asuka
3a111b67e2 refactor(DOA_SAC_sim2real): 优化代码设置并准备模型加载路径
- 将 tempt 变量初始化为 0- 更新模型加载路径为具体文件夹位置
- 显式指定共享模型在 GPU 上运行
- 修正本地模型初始化,使用 SAC 替代 SAC_Model
2025-05-28 20:07:40 +08:00
Asuka
c76dab54b0 refactor(DOA_SAC_sim2real): 重构代码以实现多进程并行训练
- 移除了原有的单进程训练代码
- 新增了多进程并行训练的框架和函数
- 优化了代码结构,提高了训练效率- 为每个进程分配独立GPU,实现并行训练
- 添加了共享模型和本地模型的同步机制
2025-05-28 20:00:17 +08:00
456ed76e47 refactor(DOA_SAC_sim2real): 重构代码以提高可读性和效率
- 移除了大量未使用的变量和函数
- 简化了环境初始化和步进逻辑
- 删除了冗余的奖励计算代码
-优化了障碍物初始化
-调整了边界惩罚机制- 移除了不必要的导入
2025-05-28 15:44:27 +08:00
b219659545 feat(env): 优化环境参数和奖励机制以提升学习效果
- 添加 jkrc 模块路径并处理导入异常
- 实现环境边界随机化和动态障碍物速度扩展
- 优化观测空间维度和低通滤波器参数
- 引入距离变化跟踪和方向对齐奖励
-增强动作平滑惩罚和障碍物渐进式惩罚
- 优化底座旋转奖励和边界感知参数
- 改进奖励计算方法,包括渐进式距离奖励和边界惩罚
- 实现障碍物位置随机初始化
-调整 SAC 模型参数以提高学习性能
2025-05-28 00:20:28 +08:00
e3b17f5eb2 refactor(env): 优化 DOA_SAC_sim2real 脚本
- 修改了 URDF 文件路径
- 删除了冗余代码和注释
- 调整了代码格式和缩进,提高了可读性
- 更新了模型保存路径
2025-05-27 21:55:49 +08:00
3d914c8c53 build: 添加项目依赖文件 requirements.txt
- 新增 requirements.txt 文件,列出项目所需的所有 Python 包及其版本
- 包含机器学习、数据处理、网络请求等多方面的依赖库
- 确保项目环境的一致性和可复现性
2025-05-27 15:27:36 +08:00
f02a735179 feat(urdf): 添加吸盘模型和测试用例
- 新增吸盘模型文件 base.obj
- 添加多个测试用例 URDF 文件,包括立方体、圆柱体等简单模型
- 创建 jaka_description 包的 CMakeLists.txt 和 display.launch 文件
2025-05-27 15:16:30 +08:00