检索结果

Select

1. 基于全局状态预测与公平经验重放的交通信号控制算法

缪孜珺, 罗飞, 丁炜超, 董文波

《计算机应用》唯一官方网站 2025, 45 (1): 337-344. DOI: 10.11772/j.issn.1001-9081.2024010066

摘要（132）

HTML （2）

PDF （3199KB）（109）

为了应对交通拥堵而设计的高效交通信号控制算法能提升现有交通网络下的车辆通行效率。尽管深度强化学习算法在单路口交通信号控制问题上已展现出卓越的性能，然而这些算法在多路口环境下的应用仍然面临着重大的挑战——多智能体强化学习（MARL）算法产生的时间和空间的部分可观测性引发的非平稳性问题会导致这些算法无法稳定的收敛。因此，提出一种基于全局状态预测与公平经验重放的多路口交通信号控制算法IS-DQN。一方面，基于不同车道的车流历史信息预测多路口的全局状态，从而扩展IS-DQN的状态空间，以避免算法产生空间部分可观测性而带来非平稳性问题；另一方面，为应对传统经验重放策略的时间部分可观测性，采用蓄水池抽样算法来保证经验重放池的公正性，进而避免其中的非平稳性问题。在复杂的多路口环境下应用IS-DQN算法进行3种不同的交通压力仿真实验的结果表明：在不同交通流情况下，尤其是在中低交通流量下，相较于独立的深度强化学习算法，IS-DQN算法能得到更短的车辆平均行驶时间，并表现出了更优的收敛性能与收敛稳定性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于强化学习的交通情景问题决策优化

罗飞, 白梦伟

《计算机应用》唯一官方网站 2022, 42 (8): 2361-2368. DOI: 10.11772/j.issn.1001-9081.2021061012

摘要（622）

HTML （19）

PDF （735KB）（199）

在复杂交通情景中求解出租车路径规划决策问题和交通信号灯控制问题时，传统强化学习算法在收敛速度和求解精度上存在局限性；因此提出一种改进的强化学习算法求解该类问题。首先，通过优化的贝尔曼公式和快速Q学习（SQL）机制，以及引入经验池技术和直接策略，提出一种改进的强化学习算法GSQL-DSEP；然后，利用GSQL-DSEP算法分别优化出租车路径规划决策问题中的路径长度与交通信号灯控制问题中的车辆总等待时间。相较于Q学习、快速Q学习（SQL）、、广义快速Q学习（GSQL）、Dyna-Q算法，GSQL-DSEP算法在性能测试中降低了至少18.7%的误差，在出租车路径规划决策问题中使决策路径长度至少缩短了17.4%，在交通信号灯控制问题中使车辆总等待时间最多减少了51.5%。实验结果表明，相较于对比算法，GSQL-DSEP算法对解决交通情景问题更具优势。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 多特征融合的运动想象脑电特征提取方法

罗飞, 刘鹏飞, 罗元, 朱思蒙

《计算机应用》唯一官方网站 2020, 40 (2): 616-620. DOI: 10.11772/j.issn.1001-9081.2019071167

摘要（489）

HTML （5）

PDF （699KB）（560）

针对单一特征识别率低、自适应性差等问题，提出一种基于希尔伯特-黄变换（HHT）和共同空间模式（CSP）的特征提取方法HCHT。首先，对原始脑电信号（EEG）进行经验模态分解（EMD）得到固有模态函数（IMF），并将IMF分量合并成新的信号矩阵；然后，对IMF进行希尔伯特谱分析，得到信号的时-频域特征；接着，对构造的信号矩阵进行进一步的CSP分解，将时-频域特征扩展成时-频-空域特征；最后，通过支持向量机（SVM）对特征集进行分类。在BCI Competition II数据集的实验表明，与HHT时-频域和CSP空域特征的方法相比，所提方法的识别准确率分别提高了7.5、10.3和9.2个百分点，且标准差更小。在智能轮椅平台进行在线实验的结果表明，HCHT能有效提高识别准确率和稳定性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于柱面模型的鱼眼影像校正方法的研究

周辉罗飞李慧娟冯炳枢

计算机应用

摘要（1358）

PDF （919KB）（1403）

鱼眼镜头突破普通相机对视场的限制，然而它存在畸变。从基于球面透视的柱面模型出发，介绍如何对整幅鱼眼影像进行畸变校正，提出一种基于球面透视的柱面模型的等弧长映射方法，并给出具体算法的推导，实现了对鱼眼影像畸变的校正，取得了较好的效果。