%0 Journal Article %A 蔡则苏 %A 柯文德 %A 彭志平 %A 朴松昊 %A 苑全德 %T 基于π演算的足球机器人协作Q学习方法 %D 2011 %R 10.3724/SP.J.1087.2011.00654 %J 计算机应用 %P 654-656 %V 31 %N 03 %X 针对多机器人协作学习时出现的学习速度慢、学习效率低等问题,提出了一种基于π演算心智模型的足球机器人协作Q学习方法,描述了机器人的运动模型,定义了球场现状、目标、意图、行为、协作、请求、扩展知识、能力判断和联合意图等机器人心智状态,构造了联合奖励函数。最后通过实验验证了方法的有效性。 %U http://www.joca.cn/CN/10.3724/SP.J.1087.2011.00654