• • 下一篇
王昱,赵明月,周小琳
摘要: 全球老龄化问题日益严峻,养老服务领域面临严重人力短缺挑战,亟需引入具有智能决策能力的机器人技术。针对养老院场景下辅助机器人在多任务机制中的自主路径规划问题,提出一种改进的非确定性策略(SAC)强化学习决策算法。首先,提出基于虚拟圆的障碍物轮廓重构法,在降低环境建模难度的同时提升雷达探测效率;其次,针对强化学习算法在求解连续状态空间内复杂任务时从零进行策略寻优的困难,将鲸鱼优化算法(WOA)与SAC算法相结合,通过构建辅助监督机制为学习过程提供方向引导,提升决策能力的同时显著提升收敛速度;最后,基于老人的日常需求进行任务规划,在包含静态障碍、动态障碍的固定任务和突发性随机任务环境中完成模型训练。仿真实验结果表明,与传统SAC算法相比,WOA-SAC算法的平均路径长度由48m缩短至43m,成功率由75%提高了5至80%,平均步长由270减小至190,能够显著提升SAC算法的学习效率和决策能力,解决多任务机制中的自主路径规划问题。
中图分类号: