文中研究了彩色文本图像的高倍压缩方法。首先利用灰度窗口变换和整体阈值将原图二值化;然后进行亚采样处理并编码;在编码过程中,以经典的哈夫曼及游程编码为基础,设计了一种特殊的码流传输方式;最后用不同的插值方法近似的恢复了图像。实验结果证明,利用该方法当压缩比达到100倍以上时,恢复图像仍然具有高度的保真性。
分析了使用构件技术实现媒体播放器的优势:可自动替换解码器、可动态升级等。并以DirectShow为例,说明构件媒体播放器的实现方法。通过对DirectShow的深入分析(同步问题和控制问题),简化改进DirectShow,提出一套新的基于构件的媒体播放器的接口定义和实现方案。该方案可以支持硬件解码器,而且可以扩展到媒体捕捉方面。
压缩域的图像分析处理技术已成为多媒体研究领域的一个热点。文中给出了DCT压缩域图像边缘的快速检测方法。该方法直接利用DCT非零系数计算图像边缘点,不需要完全解压缩,与传统象素域边缘检测方法相比,大大降低了计算复杂度,并且能根据需要提取不同精度的边缘图像。该方法在远程目标识别或基于边缘的Web图像检索等方面将能满足一定的实时性要求,具有较好的实用价值。针对JPEG图像,给出了边缘提取的实验结果,并与传统的象素域边缘检测方法进行了比较。
视频图像分割是视频目标定位和识别的基础,如果背景中光线变化,那么将会给分割带来很大的影响。文中利用贝叶斯学习方法进行视频图像分割,在每个象素点处对不断变化的背景建模,计算每个象素点处的颜色直方图,用这些直方图来表示该象素点处特征向量的概率分布,然后用贝叶斯学习方法来判断,在光线缓慢或者突然变化的时候,每个象素点是属于前景还是属于背景。
提出了一种基于小波变换和k均值聚类的快速纹理图像分割算法。该方法包括特征提取、特征平滑、纹理分割三个阶段。其中,特征提取在金字塔结构小波变换的基础上进行;特征平滑利用一种四分法来完成特征图像的噪声平滑和边缘保持;纹理分割则利用kd树作为数据结构来运行k均值聚类算法从而实现纹理图像的快速分割。实验结果表明与直接的k均值聚类算法相比,该方法在运行时间上得到了明显的提高。
测试模型5(TM5)的位分配策略对基于图像序列编码的图像质量会造成一定影响。文中在分析测试模型的位分配策略的基础上,给出了一种改进的基于MPEG 2的位分配策略。该策略能够提高序列图像编码质量的平滑性,从而避免图像质量之间的失衡。模拟结果表明,改进的码率控制策略在一定程度上提高了图像的质量,同时还保持序列图像之间的平滑性而保持压缩比不变。