✅ 操作成功!

一种3D视频中立体字幕叠加技术

发布时间:2023-12-10 作者:admin 来源:讲座

2023年12月10日发(作者:)

-

一种3D视频中立体字幕叠加技术

文章编号:1002—8692(2011)20--0032—03 一种3D视频中立体字幕叠加技术 梁丽,褚晶辉,张小佩,李英敏 (天津大学电视与图像信息研究所,天津300072) 【摘要】运用3D字幕视差与背景景深的对应关系,基于立体视觉的双日视差原理叠加3D字幕,实现了基于三维图像内容的 景深叠加3D字幕的系统。该立体字幕叠加方法具有简单、稳健等特点,缓解了观看时的视觉疲劳问题,使观众更舒适地观看立 体图像和字幕。 【关键词】立体视觉;立体字幕;双目视差;OpenGL 【中图分类号】TN948;TN949.13 【文献标识码】A Method for Overlaying Stereoscopic Subtitles in 3D Video LIANG Li,CHU Jinghui,ZHANG Xiaopei,LI Yingmin (Institute ofTV&ImageInformation,Tianjin University,Tianjin 300072,Ch/na J 【Abstract】In the paper,a system for overlaying stereoscopic subtitles has been realized based on the depth of stereoscopic image content,which is based on the prineiple of binocular disparity to overlay three—dimension subtitles by using the corresponding relation of 3D subtiles dtisparity and depth of ield.Thifs method for overlaying stereoscopic subtides is simple and robust,which will relieve problems like eye fatigue and ITIO ̄On sickness experi— enced by viewers.Viewers can read the stereo images and subtitles with ease and comfort. 【Key words】stereo vision;stereoscopic subtitle;binocular disparity;OpenGL 0 引言 素。Julesz利用随机点图已经证明,在排除一切心理立 体视觉之后,一组完全无异议的视觉刺激,只要具备视 随着科技进步和人们对生活品质的不断追求,3D电 差条件,就能经双眼产生深度上的感觉 J。双目视差 影已一步步走进我们的生活。与传统二维影视的无深度 反映了客观景物的深度信息。具有视差的双眼视图经 和临场感的显示技术不同,3D电影给观众带来身临其境 视觉皮层融合,产生立体感。若能为左右眼提供同一 的逼真感觉和无与伦比的立体观赏效果。 场景的立体图像对,并采用光学或其他技术措施,使观 3D电影的盛行迫切需求3D字幕技术的革新。目前 看者的左右眼分别只能看见对应的左右眼视图,则观 的3D电影往往将字幕直接放置在立体图像的最前面,字 看者就能感知到立体图像。在影响生理立体视觉与心 幕自始至终浮现在银幕前,并没有考虑立体图像内容的景 理立体视觉的诸多因素中,与立体图像有直接关系的 深变化,观众很难同时看到字幕和内容,眼睛会感到累甚 只有双目视差。即,影响人眼立体视觉的外界因素主 至头昏眼花,没有解决视觉疲劳问题。立体图像强烈的纵 要是立体图像中的双目视差信息。 深感,是叠加3D字幕时必须考虑的因素。针对上述问 立体图像固然生动形象,但由于当前技术条件限制 题,文献[1]提出了3D字幕与立体图像内容自适应的解 观看时会产生视觉疲劳问题,其主要原因是双目会聚与焦 决方案,将三维图像做垂直样本线投影将其简化为一个抽 点调节不一致 J。现实世界中会聚与焦点调节是一致 象图像对,计算代理深度以确定一个字幕元素的渲染属 的,然而在观看立体图像时,若视差大小在融合范围 内, 性。此方法极大的加快了深度的计算,具有实时性,但由 调节和会聚距离虽然不一致,但是仍可以把左右眼视差图 于丢失了大量信息而不可避免地降低可靠性。本文经过 像融合成一幅立体图像,观看者在立体屏幕上看到的是一 实验,提出了3D字幕视差与立体图像景深的对应关系, 缓解了观看时的视觉疲劳问题,可实现更好的观看效果。 幅具有纵深感的立体图像;若视差的大小在融合范围之 图像,观看者看到的是一幅不清晰的串扰图像,从而产生 严重的视觉疲劳。 基于立体视觉的双目视差原理叠加3D字幕,一定程度上 外,观看者则无法将左右眼两幅视差图像融合成一幅立体 l 立体视觉 人类的立体视觉由心理立体视觉与生理立体视觉 2 立体字幕叠加 组成 。双眼视差 是人眼最强烈的生理立体视觉因 综合影响立体视觉的诸多因素,在立体图像中叠加 32 洲年第35 ̄20 总第姗期 步寻找新的种子点。最后州松弛迭代法去除误匹配点,邻 图3有一定改进,但是观众观看时会感觉不习惯。图4是 域均值滤波和中值滤波去噪,降低噪声的干扰,增加视差 本文提出的方法实现的3D字幕叠加。通过对比不同方 的可靠性。其中误差能量公式为 法的实验结果发现,本文方法实现的3D字幕叠加效果更 加舒适流畅,符合大众的观看习惯。 (1) e(ij = 4 t*rt∑t+m (L(x,y+d,k)一 n(x,y,k)) 由上述改进的区域增长算法计算得到的视差图较理 想,算法准确且复杂度不高。在视差图上选定字幕区域, 提取字幕区域的视差最大值作为字幕的视差值。用 OpenGL在左右视图上叠加具有此视差值的字幕。 3.3 OpenGL叠加字幕 字幕区域的选择需要大量的实验测试和主观评价, 以找到令人感觉最舒适的位置。本文依据大众的观看习 惯将字幕区域选定在显示屏幕的底部,同时为了减小遮挡 问题,根据图像内容的空白区域作适当调整。 选定字幕区域,采用OpenGI 中文字体的绘制位图方 法叠加字幕” 。将左眼视图以原比例大小作为场景的背 景显示,在场景上创建具有一定属性的字体,用GDI方式 将文字形成单色位图,并在字幕区域调用OpenGL绘制位 图函数glBitmap()便可清楚地将文字显示出来。该方法 简单可行,右眼视图叠加字幕时只需将字幕水平坐标向右 平移视差值。应用OpenGL可方便、快速地更换文字内 容、字体属性及文字的位置等。随着视差的变化,字幕字 体的大小随之改变,以便观看效果清晰流畅。字体的其他 属性也需跟随立体内容改变而调整,以减少遮挡,增强观 赏性。 最后,视图与字幕一起保存为原视图大小的BMP图, 将叠加了字幕的立体图像对立体显示即可看到具有深度 感的3D字幕。 4 实验结果 利用Red Star Studio Ltd.的Benjamin Smith制作的 立体视频 ,将其分离出左右眼视图,应用本文的程序对 左右眼视图进行处理,运行结果在显示器上显示。使用的 观看设备是NVIDIA GeForce 3D立体眼镜与Samsung Syn. cMaster 2233RZ显示器,显示器的分辨力为1 680 X l 050, 刷新率为120 Hz。 图24是不同方法实现的3D字幕叠加红蓝效果图。 目前3D电影将字幕直接放置在立体图像前面,没有考虑 立体图像内容的景深情况,结果如图2所示。图3为 “Sizzle”视频中使用Poliseript 3DITOR字幕制作软件,将 3D字幕放置在银幕的顶端冈¨ 。一般冈像顶端场景深 度感不明显,3D字幕视差小甚至无视差,容易叠加。相对 34 加- 年第ss卷第加肌总第s,。期 图2普通字幕效果图 图3顶端字幕效果图 图4本文3D字幂显示效果图 根据实验结果可以得出以下结论:立体字幕放置位 置是基于立体图像内容的。立体显示的再现立体深度与 视差图的视差大小有关,字幕的视差由立体图像内容的深 度决定,并且随着立体图像序列内容的深度改变而改变。 为了获得最佳的观赏效果,需对字幕视差进行微调,使3D 字幕的位置比立体图像内容稍微靠前一些。 5 结论 可将立体图像上的3D字幕显示在一个令人感觉舒 服、可接受的深度位置的3D字幕叠加系统是很有实用价 值的。本文从人眼的视觉特性出发,分析了影响立体视觉 (下转第40页) 

-

一种3D视频中立体字幕叠加技术

👁️ 阅读量:0