《计算机应用》唯一官方网站 ›› 2026, Vol. 46 ›› Issue (3): 993-1003.DOI: 10.11772/j.issn.1001-9081.2025030334
沈斌1,2, 陈晓宁1(
), 程华2,3, 房一泉1, 王慧锋2
收稿日期:2025-04-01
修回日期:2025-05-08
接受日期:2025-05-09
发布日期:2025-05-13
出版日期:2026-03-10
通讯作者:
陈晓宁
作者简介:沈斌(1989—),男,浙江绍兴人,工程师,硕士,主要研究方向:深度学习、人工智能及其应用基金资助:
Bin SHEN1,2, Xiaoning CHEN1(
), Hua CHENG2,3, Yiquan FANG1, Huifeng WANG2
Received:2025-04-01
Revised:2025-05-08
Accepted:2025-05-09
Online:2025-05-13
Published:2026-03-10
Contact:
Xiaoning CHEN
About author:SHEN Bin, born in 1989, M. S., engineer. His research interests include deep learning, artificial intelligence and its application.Supported by:摘要:
本科教学审核评估作为高等教育质量保障的重要手段,它的科学合理实施直接影响高校人才培养水平。然而,传统的人工审阅模式在面对海量异构数据时效率低下且主观性强,难以满足本科教学评估对精准性和标准化的需求。因此,提出一种基于大语言模型(LLM)和多智能体架构的本科教学评估系统——智评宝(SmartEval)。该系统通过语义理解模块解析输入内容,并利用计划器进行任务分解与调度,同时结合检索增强生成(RAG)模块及问答、摘要与诊断三类智能体实现对“数据采集-指标分析-决策支持”全流程的自动化处理。在2023年度部分高校本科教学评估的“1+3+3”系列报告基础上的实验结果表明,与GLM-4和Qwen2.5等主流LLM相比,SmartEval在问答准确率、摘要ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation L)值以及诊断F1值等指标上均表现出显著优势。进一步地,通过与专家组的一致性检验比对,验证了SmartEval结果的可靠性。
中图分类号:
沈斌, 陈晓宁, 程华, 房一泉, 王慧锋. 基于大语言模型的本科教学评估智能系统[J]. 计算机应用, 2026, 46(3): 993-1003.
Bin SHEN, Xiaoning CHEN, Hua CHENG, Yiquan FANG, Huifeng WANG. Intelligent undergraduate teaching evaluation system based on large language models[J]. Journal of Computer Applications, 2026, 46(3): 993-1003.
| 报告类型 | 报告名称 | 平均页数 |
|---|---|---|
| 教学系列报告 | 本科教学状态数据分析报告 | 101.5 |
| 教师教学体验调查报告 | 49.3 | |
| 在校生学习体验调查报告 | 123.8 | |
| 就业系列报告 | 本科毕业生跟踪调查报告 | 21.2 |
| 本科生就业数据分析报告 | 23.3 | |
| 用人单位跟踪调查报告 | 14.6 | |
| 其他 | 自评报告 | 94.8 |
| 支撑材料 | 1 137.7 | |
| 合计 | — | 1 566.2 |
表1 “1+3+3”系列报告的情况
Tab. 1 Overview of “1+3+3” series reports
| 报告类型 | 报告名称 | 平均页数 |
|---|---|---|
| 教学系列报告 | 本科教学状态数据分析报告 | 101.5 |
| 教师教学体验调查报告 | 49.3 | |
| 在校生学习体验调查报告 | 123.8 | |
| 就业系列报告 | 本科毕业生跟踪调查报告 | 21.2 |
| 本科生就业数据分析报告 | 23.3 | |
| 用人单位跟踪调查报告 | 14.6 | |
| 其他 | 自评报告 | 94.8 |
| 支撑材料 | 1 137.7 | |
| 合计 | — | 1 566.2 |
| 一级指标 | 二级指标 |
|---|---|
| 党的领导 | 党的全面领导和社会主义办学方向 |
| 质量保障能力 | 质保理念 |
| 质量标准 | |
| 质保机制 | |
| 质量文化 | |
| 质保效果 | |
| 教育教学水平 | 思政教育 |
| 本科地位 | |
| 教师队伍 | |
| 学生发展与支持 | |
| 卓越教学 | |
| 就业与创新创业教育 |
表2 本轮本科教育质量评估的核心评估指标
Tab. 2 Core evaluation metrics for undergraduate education quality assessment in this round
| 一级指标 | 二级指标 |
|---|---|
| 党的领导 | 党的全面领导和社会主义办学方向 |
| 质量保障能力 | 质保理念 |
| 质量标准 | |
| 质保机制 | |
| 质量文化 | |
| 质保效果 | |
| 教育教学水平 | 思政教育 |
| 本科地位 | |
| 教师队伍 | |
| 学生发展与支持 | |
| 卓越教学 | |
| 就业与创新创业教育 |
| 测试维度 | 对比方法 | 评价指标 |
|---|---|---|
| 问答功能 | 原生LLM | 指标召回比 |
| 指标精确比 | ||
| 数据正确比 | ||
| 摘要功能 | 原生LLM | ROUGE-L |
| 关键信息覆盖率 | ||
| 诊断功能 | 原生LLM | 诊断F1值 |
| 改进建议可行性 | ||
| 综合评估 | 专家组评估 | 一致性检验 |
表3 对比方法与评价指标
Tab. 3 Comparison methods and evaluation metrics
| 测试维度 | 对比方法 | 评价指标 |
|---|---|---|
| 问答功能 | 原生LLM | 指标召回比 |
| 指标精确比 | ||
| 数据正确比 | ||
| 摘要功能 | 原生LLM | ROUGE-L |
| 关键信息覆盖率 | ||
| 诊断功能 | 原生LLM | 诊断F1值 |
| 改进建议可行性 | ||
| 综合评估 | 专家组评估 | 一致性检验 |
| 模型 | 问答功能 | 摘要功能 | 诊断功能 | ||||
|---|---|---|---|---|---|---|---|
| RR/% | PR/% | AR/% | ROUGE-L/% | Coverage/% | F1/% | FS | |
| GLM-4 | 49.4 | 52.1 | 88.8 | 36.6 | 66.4 | 50.3 | 10.1 |
| GLM-4-Plus | 89.4 | 90.1 | 97.2 | 46.9 | 70.3 | 82.0 | 11.3 |
| GLM-4-Long | 84.5 | 78.5 | 89.9 | 32.1 | 69.2 | 80.2 | 9.3 |
| moonshot-v1-8k | 52.3 | 65.6 | 88.2 | 14.5 | 27.2 | 68.7 | 6.7 |
| kimi-latest-8k | 88.3 | 87.1 | 94.2 | 29.3 | 43.9 | 83.5 | 12.7 |
| doubao-1.5-pro-32k | 85.1 | 84.5 | 95.0 | 45.6 | 70.4 | 82.1 | 10.8 |
| doubao-1.5-lite-32k | 67.6 | 66.6 | 82.5 | 24.7 | 34.1 | 67.2 | 7.8 |
| doubao-pro-32k | 61.9 | 68.2 | 86.7 | 30.8 | 50.5 | 69.1 | 7.8 |
| Qwen2.5-14b-instruct | 72.1 | 70.3 | 86.5 | 28.3 | 32.1 | 70.5 | 7.5 |
| Qwen2.5-32b-instruct | 73.9 | 76.2 | 82.4 | 29.1 | 38.0 | 75.4 | 8.8 |
| Qwen2.5-72b-instruct | 56.7 | 60.2 | 86.8 | 31.7 | 65.5 | 58.6 | 8.5 |
| Qwen-long | 42.7 | 48.9 | 84.2 | 31.1 | 56.1 | 46.7 | 8.3 |
| DeepSeek-V3 | 90.2 | 87.8 | 96.2 | 41.2 | 72.0 | 83.5 | 12.8 |
| DeepSeek-R1-Distill-Q14B | 75.5 | 77.1 | 88.1 | 18.8 | 28.3 | 78.1 | 9.2 |
| DeepSeek-R1-Distill-Q32B | 76.7 | 79.9 | 94.3 | 20.1 | 34.6 | 80.4 | 10.5 |
| hunyuan-turbo | 55.1 | 62.9 | 81.3 | 43.3 | 65.8 | 63.1 | 9.3 |
| hunyuan-large | 64.5 | 72.3 | 90.1 | 47.1 | 67.8 | 72.3 | 10.3 |
| hunyuan-standard | 68.8 | 62.7 | 85.5 | 30.6 | 49.6 | 62.4 | 9.1 |
| SmartEval | 91.3 | 92.1 | 97.6 | 49.3 | 78.8 | 85.7 | 13.4 |
表4 不同模型的对比实验结果
Tab. 4 Comparison experimental results of different models
| 模型 | 问答功能 | 摘要功能 | 诊断功能 | ||||
|---|---|---|---|---|---|---|---|
| RR/% | PR/% | AR/% | ROUGE-L/% | Coverage/% | F1/% | FS | |
| GLM-4 | 49.4 | 52.1 | 88.8 | 36.6 | 66.4 | 50.3 | 10.1 |
| GLM-4-Plus | 89.4 | 90.1 | 97.2 | 46.9 | 70.3 | 82.0 | 11.3 |
| GLM-4-Long | 84.5 | 78.5 | 89.9 | 32.1 | 69.2 | 80.2 | 9.3 |
| moonshot-v1-8k | 52.3 | 65.6 | 88.2 | 14.5 | 27.2 | 68.7 | 6.7 |
| kimi-latest-8k | 88.3 | 87.1 | 94.2 | 29.3 | 43.9 | 83.5 | 12.7 |
| doubao-1.5-pro-32k | 85.1 | 84.5 | 95.0 | 45.6 | 70.4 | 82.1 | 10.8 |
| doubao-1.5-lite-32k | 67.6 | 66.6 | 82.5 | 24.7 | 34.1 | 67.2 | 7.8 |
| doubao-pro-32k | 61.9 | 68.2 | 86.7 | 30.8 | 50.5 | 69.1 | 7.8 |
| Qwen2.5-14b-instruct | 72.1 | 70.3 | 86.5 | 28.3 | 32.1 | 70.5 | 7.5 |
| Qwen2.5-32b-instruct | 73.9 | 76.2 | 82.4 | 29.1 | 38.0 | 75.4 | 8.8 |
| Qwen2.5-72b-instruct | 56.7 | 60.2 | 86.8 | 31.7 | 65.5 | 58.6 | 8.5 |
| Qwen-long | 42.7 | 48.9 | 84.2 | 31.1 | 56.1 | 46.7 | 8.3 |
| DeepSeek-V3 | 90.2 | 87.8 | 96.2 | 41.2 | 72.0 | 83.5 | 12.8 |
| DeepSeek-R1-Distill-Q14B | 75.5 | 77.1 | 88.1 | 18.8 | 28.3 | 78.1 | 9.2 |
| DeepSeek-R1-Distill-Q32B | 76.7 | 79.9 | 94.3 | 20.1 | 34.6 | 80.4 | 10.5 |
| hunyuan-turbo | 55.1 | 62.9 | 81.3 | 43.3 | 65.8 | 63.1 | 9.3 |
| hunyuan-large | 64.5 | 72.3 | 90.1 | 47.1 | 67.8 | 72.3 | 10.3 |
| hunyuan-standard | 68.8 | 62.7 | 85.5 | 30.6 | 49.6 | 62.4 | 9.1 |
| SmartEval | 91.3 | 92.1 | 97.6 | 49.3 | 78.8 | 85.7 | 13.4 |
| 功能 | 系统输入 | 智评宝输出 |
|---|---|---|
| 问答 | 请说明xx学校质量监控机制建立情况及运行成效方面的措施和成效。 | xx学校建立了质量监控机制,包括质量监控部门及队伍数量、结构与素质,以及质量评价及改进机制运行情况。具体来看,学校设有独立的教学质量监控部门,拥有素质优良的教学质量监控队伍,并建立了自我评价、结果反馈和持续改进机制。根据相关数据,2022年学校专兼职督导员人数为164人,督导听课学时数为3 222学时,校领导听课学时数为102小时,中层领导听课学时数为1 783学时。 |
| 体现xx学校在人才培养国际化方面的成果有哪些? | xx学校高度重视人才培养国际化,采取了多项措施。具体来看,学校加大教师海外交流力度,加强国际课程建设,并积极开拓国际联合培养项目。根据相关数据,2022年学校专任教师中具有一年以上国(境)外经历的教师比例为50.62%,在学期间赴国(境)外高校访学的学生数占在校生数的比例为1.35%,当年境外交流本科生数114人,国外学生在校本科生数258人,港澳台侨学生在校本科生数184人。 | |
| 摘要 | 请对xx学校的自评报告中“党的全面领导对学校高质量发展引领作用的体现”进行归纳和总结 | 根据xx学校的本科教育教学审核评估自评报告,党的全面领导在学校高质量发展中发挥了关键作用。 在党的领导方面,学校坚持社会主义办学方向,全面贯彻党的教育方针,落实立德树人根本任务。学校党委把方向、管大局、作决策、保落实,对学校改革发展稳定工作负总责。学校成立党委教师工作部、学生工作部、统一战线工作部等,加强思想政治工作和意识形态工作,将党的领导贯穿教育教学全过程。 在党的组织建设方面,学校加强基层党组织建设,实施教师党支部书记“双带头人”培育工程,选优配强基层党组织负责人。学校党委坚持民主集中制,落实“三重一大”决策制度,充分发扬党内民主,加强党内监督,严肃党内政治生活,营造风清气正的政治生态。 在党的纪律建设方面,学校深入推进党风廉政建设,严格落实中央八项规定精神,坚决反对“四风”,强化监督执纪问责,坚决查处违纪违法行为。 在党的思想建设方面,学校加强理论武装,深入学习贯彻习近平新时代中国特色社会主义思想,扎实开展“两学一做”学习教育,巩固深化“不忘初心、牢记使命”主题教育成果。 综上所述,党的全面领导对学校高质量发展起到了关键引领作用,为学校提供了坚强的政治保证。 |
| 诊断 | xx学校在教学经费投入方面的情况?与其他学校相比? | 相关指标: 生均年教学日常运行支出:4 312.52元,高于双一流建设高校常模(3 413.93元)、中管双一流建设高校常模(3 700.31元)和自定义高校常模(3 570.97元)。 教学日常运行支出占经常性预算内教育事业费拨款(205类教育拨款扣除专项拨款)与学费收入之和的比例:19.86%,高于双一流建设高校常模(15.61%)、中管双一流建设高校常模(16.52%)和自定义高校常模(15.47%)。 生均思政工作和党务工作队伍建设专项经费:409.3元,高于双一流建设高校常模(224.43元)、中管双一流建设高校常模(351.6元)和自定义高校常模(209.7元)。 生均网络思政工作专项经费:39.49元,低于双一流建设高校常模(49.98元)、中管双一流建设高校常模(52.68元)和自定义高校常模(46.71元)。 未找到相关数据指标: 教学经费支出总额(万元)、生均本科专项教学经费(万元)、学生活动经费支出(万元) 结论: xx学校在教学经费投入方面的整体表现是积极的。该校在教学日常运行上的投入力度较大,显著优于同类高校平均水平,这证实了其对教学的重视程度。在生均思政工作和党务工作队伍建设专项经费方面,xx学校的投入同样领先,显示出该校对思政和党务工作队伍建设的重视。然而在网络思政工作专项经费的投入上,xx学校可能存在一定的提升空间。 |
表5 智评宝的案例分析
Tab. 5 Cases study of SmartEval
| 功能 | 系统输入 | 智评宝输出 |
|---|---|---|
| 问答 | 请说明xx学校质量监控机制建立情况及运行成效方面的措施和成效。 | xx学校建立了质量监控机制,包括质量监控部门及队伍数量、结构与素质,以及质量评价及改进机制运行情况。具体来看,学校设有独立的教学质量监控部门,拥有素质优良的教学质量监控队伍,并建立了自我评价、结果反馈和持续改进机制。根据相关数据,2022年学校专兼职督导员人数为164人,督导听课学时数为3 222学时,校领导听课学时数为102小时,中层领导听课学时数为1 783学时。 |
| 体现xx学校在人才培养国际化方面的成果有哪些? | xx学校高度重视人才培养国际化,采取了多项措施。具体来看,学校加大教师海外交流力度,加强国际课程建设,并积极开拓国际联合培养项目。根据相关数据,2022年学校专任教师中具有一年以上国(境)外经历的教师比例为50.62%,在学期间赴国(境)外高校访学的学生数占在校生数的比例为1.35%,当年境外交流本科生数114人,国外学生在校本科生数258人,港澳台侨学生在校本科生数184人。 | |
| 摘要 | 请对xx学校的自评报告中“党的全面领导对学校高质量发展引领作用的体现”进行归纳和总结 | 根据xx学校的本科教育教学审核评估自评报告,党的全面领导在学校高质量发展中发挥了关键作用。 在党的领导方面,学校坚持社会主义办学方向,全面贯彻党的教育方针,落实立德树人根本任务。学校党委把方向、管大局、作决策、保落实,对学校改革发展稳定工作负总责。学校成立党委教师工作部、学生工作部、统一战线工作部等,加强思想政治工作和意识形态工作,将党的领导贯穿教育教学全过程。 在党的组织建设方面,学校加强基层党组织建设,实施教师党支部书记“双带头人”培育工程,选优配强基层党组织负责人。学校党委坚持民主集中制,落实“三重一大”决策制度,充分发扬党内民主,加强党内监督,严肃党内政治生活,营造风清气正的政治生态。 在党的纪律建设方面,学校深入推进党风廉政建设,严格落实中央八项规定精神,坚决反对“四风”,强化监督执纪问责,坚决查处违纪违法行为。 在党的思想建设方面,学校加强理论武装,深入学习贯彻习近平新时代中国特色社会主义思想,扎实开展“两学一做”学习教育,巩固深化“不忘初心、牢记使命”主题教育成果。 综上所述,党的全面领导对学校高质量发展起到了关键引领作用,为学校提供了坚强的政治保证。 |
| 诊断 | xx学校在教学经费投入方面的情况?与其他学校相比? | 相关指标: 生均年教学日常运行支出:4 312.52元,高于双一流建设高校常模(3 413.93元)、中管双一流建设高校常模(3 700.31元)和自定义高校常模(3 570.97元)。 教学日常运行支出占经常性预算内教育事业费拨款(205类教育拨款扣除专项拨款)与学费收入之和的比例:19.86%,高于双一流建设高校常模(15.61%)、中管双一流建设高校常模(16.52%)和自定义高校常模(15.47%)。 生均思政工作和党务工作队伍建设专项经费:409.3元,高于双一流建设高校常模(224.43元)、中管双一流建设高校常模(351.6元)和自定义高校常模(209.7元)。 生均网络思政工作专项经费:39.49元,低于双一流建设高校常模(49.98元)、中管双一流建设高校常模(52.68元)和自定义高校常模(46.71元)。 未找到相关数据指标: 教学经费支出总额(万元)、生均本科专项教学经费(万元)、学生活动经费支出(万元) 结论: xx学校在教学经费投入方面的整体表现是积极的。该校在教学日常运行上的投入力度较大,显著优于同类高校平均水平,这证实了其对教学的重视程度。在生均思政工作和党务工作队伍建设专项经费方面,xx学校的投入同样领先,显示出该校对思政和党务工作队伍建设的重视。然而在网络思政工作专项经费的投入上,xx学校可能存在一定的提升空间。 |
| 二级指标 | Kappa | 二级指标 | Kappa |
|---|---|---|---|
| 质保机制 | 0.69 | 学生发展与支持 | 0.81 |
| 质保效果 | 0.71 | 卓越教学 | 0.86 |
| 思政教育 | 0.73 | 就业与创新创业教育 | 0.75 |
| 本科地位 | 0.79 | 平均 | 0.76 |
| 教师队伍 | 0.72 |
表6 智评宝的综合评估实验结果
Tab. 6 Comprehensive evaluation experimental results of SmartEval
| 二级指标 | Kappa | 二级指标 | Kappa |
|---|---|---|---|
| 质保机制 | 0.69 | 学生发展与支持 | 0.81 |
| 质保效果 | 0.71 | 卓越教学 | 0.86 |
| 思政教育 | 0.73 | 就业与创新创业教育 | 0.75 |
| 本科地位 | 0.79 | 平均 | 0.76 |
| 教师队伍 | 0.72 |
| 二级指标 | 专家问题清单 | 智评宝问题清单 |
|---|---|---|
| 质保机制 | 学校质量监测数据与评价结果分析利用不足。 | 加强教学质量监控人员的专业培训,提升其教学评价、数据分析、信息化应用等方面的能力。 |
| 质保效果 | 课堂教学方法、手段创新不够,课堂教学效果有待进一步提升。 | 课程“两性一度”仍有提升空间,适当增加课程的挑战度,激发学生的学习兴趣和积极性,提升学生的综合能力。 |
| 思政教育 | 思政课专任教师与专职党务工作人员数量、思政课专任教师与折合在校生比例、专职党务工作人员和思想政治工作人员总数与全校师生人数比例等数据未达到教育部标准。马克思主义学院整体实力有待加强,正高职称思政课教师人数较少、年龄偏大,有潜力的中青年教师不多。 | 思政课专任教师与折合在校生比例低于标准。 思政课专任教师与全日制在校生比例低于标准。 专职党务工作人员和思想政治工作人员总数与全校师生人数比例低于标准。 思政师资队伍整体水平较高,但高级职称教师比例有待提升。 |
| 本科地位 | 学校层面仍存在 “重科研、轻教学”现象。部分教师投入教学的精力不够。教授指导毕业设计比例不高。高水平教师投入本科教育教学不够,近三年教授为本科生上课比例低,未达到自选常模值。 教学激励制度还有待进一步完善。 全校层面以书记校长为牵头定期开展的全校本科教学工作研讨推动会议尚未形成制度化模式。校领导听课学时数偏少。 | 高层次人才为本科授课占比、课时数占比偏低,投入本科教育教学还不够,在本科生培养中的作用尚需提高。 部分新引进的高层次人才重科研、轻教学的现象较为凸显,需要加强引导和激励。 校领导听课学时数呈现上升趋势,表明学校对本科教学的质量监控力度有所加强,但仍处于较低水平,需要进一步提升。 |
| 教师队伍 | 教师队伍中外聘教师的教学组织、教学质量控制、教学评价等教学管理不够到位,规范性存在不足。 | 需进一步加强国际教师的引进、学生赴国际交流的规模、联合培养项目的数量和质量、国际会议的参与度以及国际组织实习和任职的渠道,以提升学校的国际化水平,更好地服务国家战略和经济社会发展需求。 |
| 学生发展与支持 | 自主、多元、进阶式个性化发展有待进一步完善。 | 自主多元进阶式个性化发展体系有待完善、教师教育教学和育人能力有待增强、实践教学体系有待优化整合。 |
| 卓越教学 | 学科专业设置和动态调整有待优化。 | 学科专业设置和动态调整有待优化。 |
| 就业与创新创业教育 | 专职就业指导教师和专职就业工作人员与应届毕业生比例低于教育部规定的要求。专业指导教师在学生就业与职业生涯规划方面的指导有待进一步加强。 | 师资建设、经费投入和项目建设等方面仍有提升空间。 毕业生对专业的认可度有待提高。 |
表7 综合评估的对比案例
Tab. 7 Comparison cases for comprehensive evaluation
| 二级指标 | 专家问题清单 | 智评宝问题清单 |
|---|---|---|
| 质保机制 | 学校质量监测数据与评价结果分析利用不足。 | 加强教学质量监控人员的专业培训,提升其教学评价、数据分析、信息化应用等方面的能力。 |
| 质保效果 | 课堂教学方法、手段创新不够,课堂教学效果有待进一步提升。 | 课程“两性一度”仍有提升空间,适当增加课程的挑战度,激发学生的学习兴趣和积极性,提升学生的综合能力。 |
| 思政教育 | 思政课专任教师与专职党务工作人员数量、思政课专任教师与折合在校生比例、专职党务工作人员和思想政治工作人员总数与全校师生人数比例等数据未达到教育部标准。马克思主义学院整体实力有待加强,正高职称思政课教师人数较少、年龄偏大,有潜力的中青年教师不多。 | 思政课专任教师与折合在校生比例低于标准。 思政课专任教师与全日制在校生比例低于标准。 专职党务工作人员和思想政治工作人员总数与全校师生人数比例低于标准。 思政师资队伍整体水平较高,但高级职称教师比例有待提升。 |
| 本科地位 | 学校层面仍存在 “重科研、轻教学”现象。部分教师投入教学的精力不够。教授指导毕业设计比例不高。高水平教师投入本科教育教学不够,近三年教授为本科生上课比例低,未达到自选常模值。 教学激励制度还有待进一步完善。 全校层面以书记校长为牵头定期开展的全校本科教学工作研讨推动会议尚未形成制度化模式。校领导听课学时数偏少。 | 高层次人才为本科授课占比、课时数占比偏低,投入本科教育教学还不够,在本科生培养中的作用尚需提高。 部分新引进的高层次人才重科研、轻教学的现象较为凸显,需要加强引导和激励。 校领导听课学时数呈现上升趋势,表明学校对本科教学的质量监控力度有所加强,但仍处于较低水平,需要进一步提升。 |
| 教师队伍 | 教师队伍中外聘教师的教学组织、教学质量控制、教学评价等教学管理不够到位,规范性存在不足。 | 需进一步加强国际教师的引进、学生赴国际交流的规模、联合培养项目的数量和质量、国际会议的参与度以及国际组织实习和任职的渠道,以提升学校的国际化水平,更好地服务国家战略和经济社会发展需求。 |
| 学生发展与支持 | 自主、多元、进阶式个性化发展有待进一步完善。 | 自主多元进阶式个性化发展体系有待完善、教师教育教学和育人能力有待增强、实践教学体系有待优化整合。 |
| 卓越教学 | 学科专业设置和动态调整有待优化。 | 学科专业设置和动态调整有待优化。 |
| 就业与创新创业教育 | 专职就业指导教师和专职就业工作人员与应届毕业生比例低于教育部规定的要求。专业指导教师在学生就业与职业生涯规划方面的指导有待进一步加强。 | 师资建设、经费投入和项目建设等方面仍有提升空间。 毕业生对专业的认可度有待提高。 |
| [1] | 李志义,黎青青,宫文飞. 新一轮本科教育教学审核评估中的质量文化[J]. 高教发展与评估, 2024, 40(2): 19-29. |
| LI Z Y, LI Q Q, GONG W F. The quality culture in the new round audit evaluation of undergraduate education teaching [J]. Higher Education Development and Evaluation, 2024, 40(2): 19-29. | |
| [2] | 邬大光. 高等教育:质量、质量保障与质量文化[J]. 中国高教研究, 2022(9): 18-24. |
| WU D G. Higher education: quality, quality assurance and quality culture [J]. China Higher Education Research, 2022(9): 18-24. | |
| [3] | 中华人民共和国教育部. 教育部关于印发《普通高等学校本科教育教学审核评估实施方案(2021—2025年)》的通知[EB/OL]. [2024-07-27].. |
| Ministry of Education of the People’s Republic of China. Notice of the Ministry of Education on issuing the “Implementation plan for undergraduate education and teaching audit evaluation in regular higher education institutions ( 2021—2025)”[EB/OL]. [2024-07-27].. | |
| [4] | 杜瑞军. 什么是好的教育评估——对我国高校教育教学评估的理性审视[J]. 河北师范大学学报(教育科学版), 2021, 23(5): 24-40. |
| DU R J. What is good educational evaluation? — rational examination of quality evaluation of undergraduate education in China [J]. Journal of Hebei Normal University (Educational Science), 2021, 23(5): 24-40. | |
| [5] | 陈智勇,李晓琳. 基于循证教学理念的高校教学评价数智化转型发展路径探究[J]. 中国医学教育技术, 2024, 38(5): 639-643. |
| CHEN Z Y, LI X L. Path exploration of digital and intelligent transformation development of teaching evaluation in colleges and universities based on the concept of evidence-based teaching [J]. China Medical Education Technology, 2024, 38(5): 639-643. | |
| [6] | 陆根书,李珍艳,徐菲,等. 普通高校本科教学工作审核评估存在的问题及其改进策略[J]. 江苏高教, 2020(11): 1-8. |
| LU G S, LI Z Y, XU F, et al. Problems and countermeasures of undergraduate teaching audit evaluation in colleges and universities[J]. Jiangsu Higher Education, 2020(11): 1-8. | |
| [7] | 张学飞,张丽萍,闫盛,等. 知识图谱与大语言模型协同的个性化学习推荐[J]. 计算机应用, 2025, 45(3): 773-784. |
| ZHANG X F, ZHANG L P, YAN S, et al. Personalized learning recommendation in collaboration of knowledge graph and large language model [J]. Journal of Computer Applications, 2025, 45(3): 773-784. | |
| [8] | 董艳民,林佳佳,张征,等. 个性化学情感知的智慧助教算法设计与实践[J]. 计算机应用, 2025, 45(3): 765-772. |
| DONG Y M, LIN J J, ZHANG Z, et al. Design and practice of intelligent tutoring algorithm based on personalized student capability perception [J]. Journal of Computer Applications, 2025, 45(3): 765-772. | |
| [9] | 齐思洋,胡慧云,李洪冰,等. 融合大语言模型的领域问答系统构建方法[J]. 北京邮电大学学报, 2024, 47(4): 50-56. |
| QI S Y, HU H Y, LI H B, et al. Domain-specific question answering system construction approach integrated with large language model[J]. Journal of Beijing University of Posts and Telecommunications, 2024, 47(4): 50-56. | |
| [10] | 广田薰,周政, MERSHA B W,等. 教室环境下的教学质量AI机器评估研究进展[J]. 北京理工大学学报, 2024, 44(10): 1077-1088. |
| HIROTA K, ZHOU Z, MERSHA B W, et al. AI machine evaluation level on classroom teaching quality [J]. Transactions of Beijing Institute of Technology, 2024, 44(10): 1077-1088. | |
| [11] | SWATHI B P, GEETHA M, ATTIGERI G, et al. Optimizing question answering systems in education: addressing domain-specific challenges [J]. IEEE Access, 2024, 12: 156572-156587. |
| [12] | JENSEN L X, BUHL A, SHARMA A, et al. Generative AI and higher education: a review of claims from the first months of ChatGPT [J]. Higher Education, 2025, 89(4): 1145-1161. |
| [13] | ZOBEL T, MEINEL C. Comparing AI in online learning: the transition and trade-offs between intent-based learning assistants and LLM-Chatbots in MOOCs [C]// Proceedings of the 2024 IEEE Digital Education and MOOCS Conference. Piscataway: IEEE, 2024: 1-6. |
| [14] | 翟雪松,季爽,焦丽珍,等. 基于多智能体的人机协同解决复杂学习问题实证研究[J]. 开放教育研究, 2024, 30(3): 63-73. |
| ZHAI X S, JI S, JIAO L Z, et al. Empirical investigation of human-machine collaboration in solving complex learning problems through a LLM-based multi-agent framework [J]. Open Education Research, 2024, 30(3): 63-73. | |
| [15] | KOCSIS I, BURJÁN-MOSONI B, BALAJTI I. A comprehensive review of key cyber-physical systems, and assessment of their education challenges [J]. IEEE Access, 2025, 13: 8898-8911. |
| [16] | SENANAYAKE S, KARUNANAYAKA K, EKANAYAKE K V J P. Review on AI assistant systems for programming language learning in learning environments [C]// Proceedings of the 8th SLAAI International Conference on Artificial Intelligence. Piscataway: IEEE, 2024: 1-6. |
| [17] | McGRATH C, FARAZOULI A, CERRATTO-PARGMAN T. Generative AI chatbots in higher education: a review of an emerging research area [J]. Higher Education, 2025, 89(6): 1533-1549. |
| [18] | 余胜泉,熊莎莎. 基于大模型增强的通用人工智能教师架构[J]. 开放教育研究, 2024, 30(1): 33-43. |
| YU S Q, XIONG S S. General artificial intelligence teacher architecture based on enhanced pre-trained large models [J]. Open Education Research, 2024, 30(1): 33-43. | |
| [19] | 张兆津. 基于人工智能的职业本科教育评估系统构建与效果分析[J]. 办公自动化, 2025, 30(2): 107-109. |
| ZHANG Z J. Construction and effect analysis of an education evaluation system for vocational undergraduate based on AI [J]. Office Informatization, 2025, 30(2): 107-109. | |
| [20] | ZHANG T, JIA S, ANGELI C. Evaluation method of higher education teaching reform based on deep learning analysis technology [J]. International Journal of Web-Based Learning and Teaching Technologies, 2024, 19(1): 1-19. |
| [21] | 王战军,李旖旎. 数智时代我国高等教育评估体系的转型与重构[J]. 大学教育科学, 2024(2): 106-117. |
| WANG Z J, LI Y N. Transformation and reconstruction of higher education evaluation system in the era of digital intelligence [J]. University Education Science, 2024(2): 106-117. | |
| [22] | ZAWACKI-RICHTER O, MARÍN V I, BOND M, et al. Systematic review of research on artificial intelligence applications in higher education — where are the educators? [J]. International Journal of Educational Technology in Higher Education, 2019, 16: No.39. |
| [23] | CHEN L, CHEN P, LIN Z. Artificial intelligence in education: a review [J]. IEEE Access, 2020, 8: 75264-75278. |
| [24] | WANG G, HAN D, DENG H, et al. Construction of online teaching quality evaluation system in universities oriented by deep learning[C]// Proceedings of the 2023 5th International Conference on Computer Science and Technologies in Education. Piscataway: IEEE, 2023: 97-100. |
| [25] | ZHANG R, DU H, LIU Y, et al. Interactive AI with retrieval-augmented generation for next generation networking [J]. IEEE Network, 2024, 38(6): 414-424. |
| [26] | ASAI A, WU Z, WANG Y, et al. Self-RAG: learning to retrieve, generate, and critique through self-reflection[EB/OL]. [2024-07-15].. |
| [27] | GE J, SUN S, OWENS J, et al. Development of a liver disease-specific large language model chat interface using retrieval-augmented generation [J]. Hepatology, 2024, 80(5): 1158-1168. |
| [28] | HERMSEN F, NITZ L, AKBARI GURABI M, et al. On data spaces for retrieval augmented generation [C]// Proceedings of the INFORMATIK 2024. Bonn: Gesellschaft für Informatik e.V., 2024: 701-707. |
| [29] | ŞAHIN G, VAROL K, PAK B K. LLM and RAG-based question answering assistant for enterprise knowledge management [C]// Proceedings of the 9th International Conference on Computer Science and Engineering. Piscataway: IEEE, 2024: 1-6. |
| [30] | MILADI F, PSYCHÉ V, LEMIRE D. Leveraging GPT-4 for accuracy in education: a comparative study on retrieval-augmented generation in MOOCs [C]// Proceedings of the 2024 International Conference on Artificial Intelligence in Education, CCIS 2150. Cham: Springer, 2024: 427-434. |
| [31] | GUO T, CHEN X, WANG Y, et al. Large language model based multi-agents: a survey of progress and challenges [C]// Proceedings for the 33rd International Joint Conference on Artificial Intelligence. California: ijcai.org, 2024: 8048-8057. |
| [32] | 孙宇祥,赵俊杰,解宇轩,等. 自生成兵棋AI:基于大语言模型的双层Agent任务规划[J]. 控制与决策, 2024, 39(12): 3927-3936. |
| SUN Y X, ZHAO J J, XIE Y X, et al. Self generated wargame AI: double layer agent task planning based on large language model [J]. Control and Decision, 2024, 39(12): 3927-3936. | |
| [33] | DONG X, ZHANG X, BU W, et al. A survey of LLM-based agents: theories, technologies, applications and suggestions [C]// Proceedings of the 3rd International Conference on Artificial Intelligence, Internet of Things and Cloud Computing Technology. Piscataway: IEEE, 2024: 407-413. |
| [34] | JIN H, LEE S, SHIN H, et al. Teach AI how to code: using large language models as teachable agents for programming education[C]// Proceedings of the 2024 CHI Conference on Human Factors in Computing Systems. New York: ACM, 2024: No.652. |
| [35] | WANG L, MA C, FENG X, et al. A survey on large language model based autonomous agents [J]. Frontiers of Computer Science, 2024, 18(6): No.186345. |
| [36] | 孙科技,朱益明. “双一流”建设评估的现实困境及其超越:第四代评估理论视角[J]. 复旦教育论坛, 2021, 19(4): 100-106. |
| SUN K J, ZHU Y M. The realistic dilemma and transcendence of “double first-class” construction evaluation: from the perspective of the fourth generation evaluation theory[J]. Fudan Education Forum, 2021, 19(4): 100-106. | |
| [37] | WANG L, XU W, LAN Y, et al. Plan-and-solve prompting: improving zero-shot chain-of-thought reasoning by large language models [C]// Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg: ACL, 2023: 2609-2634. |
| [38] | 郭振东,林民,李成城,等. 基于BERT-CRF的领域词向量生成研究[J]. 计算机工程与应用, 2022, 58(21): 156-162. |
| GUO Z D, LIN M, LI C C, et al. Research on domain-specific word vector generation based on BERT-CRF [J]. Computer Engineering and Applications, 2022, 58(21): 156-162. | |
| [39] | 左俊杰,肖锋,黄姝娟,等. 一种新的异构多核平台下多类型DAG调度方法[J]. 计算机应用研究, 2025, 42(2): 514-518. |
| ZUO J J, XIAO F, HUANG S J, et al. Novel scheduling method for multi-type DAG on heterogeneous multi-core platforms [J]. Application Research of Computers, 2025, 42(2): 514-518. | |
| [40] | 文森,钱力,胡懋地,等. 基于大语言模型的问答技术研究进展综述[J]. 数据分析与知识发现, 2024, 8(6): 16-29. |
| WEN S, QIAN L, HU M D, et al. Review of research progress on question-answering techniques based on large language models [J]. Data Analysis and Knowledge Discovery, 2024, 8(6): 16-29. | |
| [41] | BARNETT S, KURNIAWAN S, THUDUMU S, et al. Seven failure points when engineering a retrieval augmented generation system [C]// Proceedings of the IEEE/ACM 3rd International Conference on AI Engineering - Software Engineering for AI. New York: ACM, 2024: 194-199. |
| [42] | KARLSEN E, LUO X, ZINCIR-HEYWOOD N, et al. Benchmarking large language models for log analysis, security, and interpretation [J]. Journal of Network and Systems Management, 2024, 32(3): No.59. |
| [43] | 马璨婧. 日本高校教育质量保障体系下的PDCA循环理论应用及启示[J]. 江苏高教, 2021(8): 110-113. |
| MA C J. Application of PDCA cycle theory under the education quality assurance system of Japanese universities and its enlightenment[J]. Jiangsu Higher Education, 2021(8): 110-113. | |
| [44] | 王洪才,刘斯琪. 论高质量高等教育评估指标体系的构建[J]. 重庆高教研究, 2024, 12(5): 3-13. |
| WANG H C, LIU S Q. On the construction of high-quality higher education evaluation index system [J]. Chongqing Higher Education Research, 2024, 12(5): 3-13. | |
| [45] | 房一泉,沈斌,程华,等. 基于深度学习的子句级文本摘要模型[J]. 计算机与数字工程, 2024, 52(7): 2135-2140. |
| FANG Y Q, SHEN B, CHENG H, et al. Clause-level text summarization model based on deep learning [J]. Computer and Digital Engineering, 2024, 52(7): 2135-2140. |
| [1] | 郗恩康, 范菁, 金亚东, 董华, 俞浩, 孙伊航. 联邦学习在隐私安全领域面临的威胁综述[J]. 《计算机应用》唯一官方网站, 2026, 46(3): 798-808. |
| [2] | 黄奕明, 邹喜华, 邓果, 郑狄. 预回答与召回过滤:双阶段RAG问答系统优化方法[J]. 《计算机应用》唯一官方网站, 2026, 46(3): 696-707. |
| [3] | 王日龙, 李振平, 李晓松, 高强, 何亚, 钟勇, 赵英潇. 多Agent协作的知识推理框架[J]. 《计算机应用》唯一官方网站, 2026, 46(3): 708-714. |
| [4] | 张昊洋, 张丽萍, 闫盛, 李娜, 张学飞. 面向知识图谱补全的大模型方法综述[J]. 《计算机应用》唯一官方网站, 2026, 46(3): 683-695. |
| [5] | 吴定佳, 崔喆. 增强模式链接与多生成器协同的SQL生成框架MG-SQL[J]. 《计算机应用》唯一官方网站, 2026, 46(3): 723-731. |
| [6] | 高飞, 陈董, 边帝行, 范文强, 刘起东, 吕培, 张朝阳, 徐明亮. 面向学科撤销后科研人员重分配的多阶段耦合决策框架[J]. 《计算机应用》唯一官方网站, 2026, 46(2): 416-426. |
| [7] | 谢欣冉, 崔喆, 陈睿, 彭泰来, 林德坤. 基于层次过滤与标签语义扩展的大模型零样本重排序方法[J]. 《计算机应用》唯一官方网站, 2026, 46(1): 60-68. |
| [8] | 林怡, 夏冰, 王永, 孟顺达, 刘居宠, 张书钦. 基于AI智能体的隐藏RESTful API识别与漏洞检测方法[J]. 《计算机应用》唯一官方网站, 2026, 46(1): 135-143. |
| [9] | 张滨滨, 秦永彬, 黄瑞章, 陈艳平. 结合大语言模型与动态提示的裁判文书摘要方法[J]. 《计算机应用》唯一官方网站, 2025, 45(9): 2783-2789. |
| [10] | 冯涛, 刘晨. 自动化偏好对齐的双阶段提示调优方法[J]. 《计算机应用》唯一官方网站, 2025, 45(8): 2442-2447. |
| [11] | 孙熠衡, 刘茂福. 基于知识提示微调的标书信息抽取方法[J]. 《计算机应用》唯一官方网站, 2025, 45(4): 1169-1176. |
| [12] | 曹鹏, 温广琪, 杨金柱, 陈刚, 刘歆一, 季学纯. 面向测试用例生成的大模型高效微调方法[J]. 《计算机应用》唯一官方网站, 2025, 45(3): 725-731. |
| [13] | 鲁超峰, 陶冶, 文连庆, 孟菲, 秦修功, 杜永杰, 田云龙. 融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法[J]. 《计算机应用》唯一官方网站, 2025, 45(3): 815-822. |
| [14] | 何静, 沈阳, 谢润锋. 大语言模型幻觉现象的识别与优化[J]. 《计算机应用》唯一官方网站, 2025, 45(3): 709-714. |
| [15] | 陈维, 施昌勇, 马传香. 基于多模态数据融合的农作物病害识别方法[J]. 《计算机应用》唯一官方网站, 2025, 45(3): 840-848. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||