计算机应用 ›› 2005, Vol. 25 ›› Issue (09): 2022-2024.DOI: 10.3724/SP.J.1087.2005.02022
傅间莲,陈群秀
FU Jian-lian,CHEN Qun-xiu
摘要: 主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题。文中提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性。实验结果表明,该算法对多主题文章的主题划分准确率为92.4%,对单主题文章的主题划分准确率为99.1%。
中图分类号: