• • 下一篇
陈佳琪1,何玉林2,成英超2,黄哲学3
摘要: 期望最大化(EM)算法在混合模型参数估计中发挥着重要作用,但现有的EM算法在求解Gamma混合模型(GaMM)参数时存在局限性,主要体现在因近似计算导致低质量的参数估计,以及由于大量数值计算造成的计算效率低下问题。为克服这些局限,并充分利用数据的多模性质,提出了一种半EM(Semi-EM)算法,以求解用于估计多模概率分布的GaMM。首先,该算法通过聚类探测数据的空间分布特性,用以初始化GaMM参数,进而更准确地刻画数据的多模性。其次,在EM算法框架的基础上,对于缺乏封闭更新表达式而导致的参数更新困难问题,采用自定义的启发式策略对GaMM形状参数进行更新,使其朝着最大化对数似然的方向逐步调整,同时以封闭形式更新其余参数。经过一系列具有说服力的实验,验证了所提出的Semi-EM算法的可行性、合理性和有效性。实验结果表明,Semi-EM算法在精确估计多模概率分布方面优于与之对比的四种算法,具体表现在Semi-EM算法具有更低的误差指标以及更高的对数似然值,表明该算法能够提供更准确的模型参数估计,从而更精确地刻画数据的多模性质。