一种基于排序学习的立体图像视觉舒适度评价方法

出售状态:已下证
专 利 号 :已交易,保密
专利类型:发明专利
专利分类:人工智能
出售价格:
直 接 购 买 联 系 客 服

详细介绍


技术领域

本发明涉及一种图像质量评价方法,尤其是涉及一种基于排序学习的立体图像视觉舒适度评价方法。


背景技术

随着立体视频显示技术和高质量立体视频内容获取技术的快速发展,立体视频的视觉体验质量(QoE,qualityofexperience)是立体视频系统设计中的一个重要问题,而视觉舒适度(VC,visualcomfort)是影响立体视频的视觉体验质量的重要因素。目前,对立体视频/图像的质量评价研究主要考虑内容失真对于图像质量的影响,而很少考虑视觉舒适度等因素的影响。因此,为了提高观看者的视觉体验质量,研究立体视频/图像的视觉舒适度客观评价模型对指导3D内容的制作和后期处理具有十分重要的作用。

传统的立体图像视觉舒适度评价方法主要是基于机器学习的方法,其需要大量的样本数据在立体图像视觉舒适度特征和主观评价值之间建立回归模型,然而由于主观评价值的获取需要通过复杂的主观实验,因此非常耗时,并不适合应用于实际的图像处理系统中。考虑到人们在进行主观实验时通常采用多等级打分制对立体图像的视觉舒适度进行评价这一事实,如何在客观评价过程中有效地模拟多等级打分机制、如何将多等级打分结果映射到不同的舒适度等级,使得客观评价结果更加符合人类视觉主观评价,是在对立体图像进行客观视觉舒适度评价过程中需要研究解决的问题。


发明内容

本发明所要解决的技术问题是提供一种基于排序学习的立体图像视觉舒适度评价方法,其无需获取立体图像的主观评价值,适合应用于实际的图像处理系统,且能够有效地提高客观评价结果与主观感知之间的相关性。

本发明解决上述技术问题所采用的技术方案为:一种基于排序学习的立体图像视觉舒适度评价方法,其特征在于包括训练阶段和测试阶段两个过程,所述的训练阶段的具体步骤为:

①-1、针对五个不同的视觉舒适度等级各选取M幅立体图像,将共选取的5×M幅立体图像构成初始训练图像集,记为Ω,Ω={Ci|1≤i≤5},其中,M≥1,Ci表示由针对第i个视觉舒适度等级选取的M幅立体图像构成的集合,Ci={Si,m|1≤m≤M},Si,m表示Ci中的第m幅立体图像;

①-2、计算Ω中的每幅立体图像的用于反映视觉舒适度的特征矢量,将Si,m的用于反映视觉舒适度的特征矢量记为Fi,m其中,Fi,m的维数为13,符号“[]”为矢量表示符号,对应表示Si,m的双目融合特征图中的所有像素点的像素值的均值、方差和熵值,对应表示Si,m的离焦模糊特征图中的所有像素点的像素值的均值、方差和熵值,对应表示Si,m的左视点图像的空间频率特征图中的所有像素点的像素值的均值、方差和熵值,χi,m、κi,m、σi,m对应表示Si,m的角视差图像中像素值最大的q%的像素点的像素值的均值、Si,m的角视差图像中像素值最小的q%的像素点的像素值的均值、Si,m的角视差图像的视差离差和Si,m的角视差图像的视差偏斜度;

①-3、采用排序学习方法求解min(12||wT||22+λ1Σδ12+λ2Σδ22)s.t.wTFi,m-wTFi+1,n≥1-δ1,∀i∈{1,2,3,4},∀m,n∈{1,2,...,M}|wTFi,m-wTFi,n|≤δ2,∀i∈{1,2,3,4,5},∀m,n∈{1,2,...,M}δ1≥0,δ2≥0,得到最优的权值矢量,记为wopt,其中,min()为取最小值函数,w表示权值矢量,wT为w的转置矢量,符号“||||2”为矩阵的2-范数符号,λ1和λ2均为控制参数,δ1和δ2均为误差参数,且δ1≠δ2,s.t.表示“受约束于”,Fi+1,n表示由针对第i+1个视觉舒适度等级选取的M幅立体图像构成的集合Ci+1中的第n幅立体图像Si+1,n的用于反映视觉舒适度的特征矢量,符号表示“任意”,符号“||”为取绝对值符号,Fi,n表示Ci中的第n幅立体图像Si,n的用于反映视觉舒适度的特征矢量;

①-4、利用得到的最优的权值矢量wopt,构造视觉舒适度排序模型,记为f(F),f(F)=(wopt)TF,其中,f()为函数表示形式,F用于表示立体图像的用于反映视觉舒适度的特征矢量,且作为视觉舒适度排序模型的输入特征矢量,(wopt)T为wopt的转置矢量;

所述的测试阶段的具体步骤为:

②对于任意一幅测试立体图像Stest,按照步骤①-2的过程,以相同的操作获取Stest的用于反映视觉舒适度的特征矢量,记为Ftest;然后根据训练阶段构造的视觉舒适度排序模型f(F)=(wopt)TF,对Ftest进行测试,预测得到Ftest对应的排序值,将该排序值作为Stest的视觉舒适度客观评价预测值,记为Qtest

所述的步骤①-2中Si,m的用于反映视觉舒适度的特征矢量Fi,m的获取过程为:

A1、采用视差估计算法计算Si,m的左视点图像与右视点图像之间的视差图像,记为{di,m(x,y)},其中,1≤x≤W,1≤y≤H,W表示Ω中的立体图像的宽度,H表示Ω中的立体图像的高度,di,m(x,y)表示{di,m(x,y)}中坐标位置为(x,y)的像素点的像素值;

然后采用视差转换算法对{di,m(x,y)}进行视差转换,得到Si,m的角视差图像,记为{φi,m(x,y)},其中,φi,m(x,y)表示{φi,m(x,y)}中坐标位置为(x,y)的像素点的像素值,如果φi,m(x,y)>0,则表示Si,m中坐标位置为(x,y)的像素点在显示时成像在屏幕前,如果φi,m(x,y)<0,则表示Si,m中坐标位置为(x,y)的像素点在显示时成像在屏幕后,如果φi,m(x,y)=0,则表示Si,m中坐标位置为(x,y)的像素点在显示时恰好成像在屏幕上;

接着计算Si,m的双目融合特征图,记为{BFi,m(x,y)},其中,BFi,m(x,y)表示{BFi,m(x,y)}中坐标位置为(x,y)的像素点的像素值,BFi,m(x,y)=1,0&le;|&phi;i,m(x,y)|&le;|&theta;|exp(-(|&phi;i,m(x,y)|-|&theta;|)22&epsiv;2),|&phi;i,m(x,y)|>|&theta;|,符号“||”为取绝对值符号,θ表示双目可融合角视差极限值,exp()表示以自然基数e为底的指数函数,ε为指数衰减控制参数;

再计算{BFi,m(x,y)}中的所有像素点的像素值的均值方差和熵值&mu;i,m(BF)=1H&times;W&Sigma;y=1H&Sigma;x=1WBFi.m(x,y),&upsi;i,m(BF)=1H&times;W&Sigma;y=1H&Sigma;x=1W(BFi,m(x,y)-&mu;i,m(BF))2,&eta;i,m(BF)=-&Sigma;l1=1k1p&lsqb;BFi,m(l1)&rsqb;ln(p&lsqb;BFi,m(l1)&rsqb;),1&le;l1&le;k1,k1为{BFi,m(x,y)}中所包含的灰度级的总数目,BFi,m(l1)表示{BFi,m(x,y)}中的第l1个灰度级的灰度值,p[BFi,m(l1)]表示BFi,m(l1)在{BFi,m(x,y)}中出现的概率,表示{BFi,m(x,y)}中像素值等于BFi,m(l1)的像素点的总个数;

A2、计算Si,m的离焦模糊特征图,记为{DBi,m(x,y)},其中,DBi,m(x,y)表示{DBi,m(x,y)}中坐标位置为(x,y)的像素点的像素值,DBi,m(x,y)=|R&times;r0Di,m(x0,y0)&times;(1-Di,m(x0,y0)Di,m(x,y))|,R表示人眼的瞳孔直径,r0表示人眼眼球的晶状体长度,Di,m(x0,y0)表示人眼观看Si,m时会聚点(x0,y0)的深度值,Di,m(x,y)表示Si,m的深度图{Di,m(x,y)}中坐标位置为(x,y)的像素点的像素值,V表示观看者与显示器之间的距离,I表示人眼的瞳孔间距,Wx和Rx对应表示显示器的水平宽度和水平分辨率;

然后计算{DBi,m(x,y)}中的所有像素点的像素值的均值方差和熵值&mu;i,m(DB)=1H&times;W&Sigma;y=1H&Sigma;x=1WDBi.m(x,y),&upsi;i,m(DB)=1H&times;W&Sigma;y=1H&Sigma;x=1W(DBi,m(x,y)-&mu;i,m(DB))2,&eta;i,m(DB)=-&Sigma;l2=1k2p&lsqb;DBi,m(l2)&rsqb;ln(p&lsqb;DBi,m(l2)&rsqb;),其中,1≤l2≤k2,k2为{DBi,m(x,y)}中所包含的灰度级的总数目,DBi,m(l2)表示{DBi,m(x,y)}中的第l2个灰度级的灰度值,p[DBi,m(l2)]表示DBi,m(l2)在{DBi,m(x,y)}中出现的概率,表示{DBi,m(x,y)}中像素值等于DBi,m(l2)的像素点的总个数;

A3、计算Si,m的左视点图像的相位一致性图作为其空间频率特征图,记为{SFi,m(x,y)},其中,SFi,m(x,y)表示{SFi,m(x,y)}中坐标位置为(x,y)的像素点的像素值;

然后计算{SFi,m(x,y)}中的所有像素点的像素值的均值方差和熵值&mu;i,m(SF)=1H&times;W&Sigma;y=1H&Sigma;x=1WSFi.m(x,y),&upsi;i,m(SF)=1H&times;W&Sigma;y=1H&Sigma;x=1W(SFi,m(x,y)-&mu;i,m(SF))2,&eta;i,m(SF)=-&Sigma;l3=1k3p&lsqb;SFi,m(l3)&rsqb;ln(p&lsqb;SFi,m(l3)&rsqb;),其中,1≤l3≤k3,k3为{SFi,m(x,y)}中所包含的灰度级的总数目,SFi,m(l3)表示{SFi,m(x,y)}中的第l3个灰度级的灰度值,p[SFi,m(l3)]表示SFi,m(l3)在{SFi,m(x,y)}中出现的概率,表示{SFi,m(x,y)}中像素值等于SFi,m(l3)的像素点的总个数;

A4、从{φi,m(x,y)}中提取出四个与视觉舒适度相关的视差统计特征,分别为{φi,m(x,y)}中像素值最大的q%的像素点的像素值的均值χi,m、{φi,m(x,y)}中像素值最小的q%的像素点的像素值的均值κi,m、{φi,m(x,y)}的视差离差σi,m、{φi,m(x,y)}的视差偏斜度&chi;i,m=1Nqmax&Sigma;(x,y)&Element;&Theta;qmax&phi;i,m(x,y),&kappa;i,m=1Nqmin&Sigma;(x,y)&Element;&Theta;qmin&phi;i,m(x,y),&sigma;i,m=1H&times;W&Sigma;y=1H&Sigma;x=1W&lsqb;&phi;i,m(x,y)&rsqb;2,其中,1≤q≤50,表示{φi,m(x,y)}中像素值最大的q%的像素点的总个数,表示{φi,m(x,y)}中像素值最大的q%的像素点的坐标位置构成的集合,表示{φi,m(x,y)}中像素值最小的q%的像素点的总个数,表示{φi,m(x,y)}中像素值最小的q%的像素点的坐标位置构成的集合;

A5、将χi,m、κi,m、σi,m按顺序进行排列构成Fi,m

所述的步骤①-1中的五个不同的视觉舒适度等级分别为极端不舒适、不舒适、略微舒适、舒适和非常舒适。

与现有技术相比,本发明的优点在于:

1)本发明方法在训练阶段,通过选取多幅不同的视觉舒适度等级的立体图像组成初始训练图像集,利用现有的排序学习方法建立初始训练图像集中的所有立体图像的用于反映视觉舒适度的特征矢量与视觉舒适度等级之间的视觉舒适度排序模型,构造得到的视觉舒适度排序模型能够有效地模拟人眼主观评价中的多等级打分机制,因此与主观评价具有高度的一致性。

2)本发明方法在测试阶段,计算测试立体图像的用于反映视觉舒适度的特征矢量,并根据训练阶段构造的视觉舒适度排序模型,预测得到测试立体图像的用于反映视觉舒适度的特征矢量对应的排序值,将该排序值作为测试立体图像的视觉舒适度客观评价预测值,由于主观评价的实质就是让主观测试者根据自身舒适度感受对测试立体图像进行多等级打分,视觉舒适度排序模型能够很好地模拟这种多等级打分机制,因此得到的视觉舒适度客观评价预测值与主观评价值保持了较好的一致性,即视觉舒适度客观评价预测值与主观感知之间的相关性高。

3)本发明方法无需获取大量的立体图像的主观评价值,耗时少,适合应用于实际的图像处理系统中。


附图说明

图1为本发明方法的总体实现框图。


具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种基于排序学习的立体图像视觉舒适度评价方法,其总体实现框图如图1所示,其包括训练阶段和测试阶段两个过程,所述的训练阶段的具体步骤为:

①-1、针对五个不同的视觉舒适度等级各选取M幅立体图像,将共选取的5×M幅立体图像构成初始训练图像集,记为Ω,Ω={Ci|1≤i≤5},其中,M≥1,在本实施例中取M=10,Ci表示由针对第i个视觉舒适度等级选取的M幅立体图像构成的集合,Ci={Si,m|1≤m≤M},Si,m表示Ci中的第m幅立体图像,符号“{}”为集合表示符号。

在具体实施时如可从宁波大学建立的立体图像视觉舒适度数据库中针对五个不同的视觉舒适度等级各选取M幅立体图像。

在此,五个不同的视觉舒适度等级分别为极端不舒适(extremelyuncomfortable)、不舒适(uncomfortable)、略微舒适(mildlycomfortable)、舒适(comfortable)和非常舒适(verycomfortable),即初始训练图像集由M幅极端不舒适的立体图像、M幅不舒适的立体图像、M幅略微舒适的立体图像、M幅舒适的立体图像和M幅非常舒适的立体图像构成。

①-2、计算Ω中的每幅立体图像的用于反映视觉舒适度的特征矢量,将Si,m的用于反映视觉舒适度的特征矢量记为Fi,m其中,Fi,m的维数为13,符号“[]”为矢量表示符号,对应表示Si,m的双目融合特征图中的所有像素点的像素值的均值、方差和熵值,对应表示Si,m的离焦模糊特征图中的所有像素点的像素值的均值、方差和熵值,对应表示Si,m的左视点图像的空间频率特征图中的所有像素点的像素值的均值、方差和熵值,χi,m、κi,m、σi,m对应表示Si,m的角视差图像中像素值最大的q%的像素点的像素值的均值、Si,m的角视差图像中像素值最小的q%的像素点的像素值的均值、Si,m的角视差图像的视差离差和Si,m的角视差图像的视差偏斜度。

在此具体实施例中,步骤①-2中Si,m的用于反映视觉舒适度的特征矢量Fi,m的获取过程为:

A1、采用现有的基于光流的视差估计算法计算Si,m的左视点图像与右视点图像之间的视差图像,记为{di,m(x,y)},其中,1≤x≤W,1≤y≤H,W表示Ω中的立体图像的宽度,H表示Ω中的立体图像的高度,di,m(x,y)表示{di,m(x,y)}中坐标位置为(x,y)的像素点的像素值。

然后采用现有的视差转换算法对{di,m(x,y)}进行视差转换,得到Si,m的角视差图像,记为{φi,m(x,y)},其中,φi,m(x,y)表示{φi,m(x,y)}中坐标位置为(x,y)的像素点的像素值,如果φi,m(x,y)>0,则表示Si,m中坐标位置为(x,y)的像素点在显示时成像在屏幕前,如果φi,m(x,y)<0,则表示Si,m中坐标位置为(x,y)的像素点在显示时成像在屏幕后,如果φi,m(x,y)=0,则表示Si,m中坐标位置为(x,y)的像素点在显示时恰好成像在屏幕上。

接着计算Si,m的双目融合特征图,记为{BFi,m(x,y)},其中,BFi,m(x,y)表示{BFi,m(x,y)}中坐标位置为(x,y)的像素点的像素值,BFi,m(x,y)=1,0&le;|&phi;i,m(x,y)|&le;|&theta;|exp(-(|&phi;i,m(x,y)|-|&theta;|)22&epsiv;2),|&phi;i,m(x,y)|>|&theta;|,符号“||”为取绝对值符号,θ表示双目可融合角视差极限值,在本实施例中取θ=1°,exp()表示以自然基数e为底的指数函数,ε为指数衰减控制参数,在本实施例中取ε=0.3。

再计算{BFi,m(x,y)}中的所有像素点的像素值的均值方差和熵值&mu;i,m(BF)=1H&times;W&Sigma;y=1H&Sigma;x=1WBFi.m(x,y),&upsi;i,m(BF)=1H&times;W&Sigma;y=1H&Sigma;x=1W(BFi,m(x,y)-&mu;i,m(BF))2,&eta;i,m(BF)=-&Sigma;l1=1k1p&lsqb;BFi,m(l1)&rsqb;ln(p&lsqb;BEi,m(l1)&rsqb;),1&le;l1&le;k1,k1为{BFi,m(x,y)}中所包含的灰度级的总数目,BFi,m(l1)表示{BFi,m(x,y)}中的第l1个灰度级的灰度值,p[BFi,m(l1)]表示BFi,m(l1)在{BFi,m(x,y)}中出现的概率,表示{BFi,m(x,y)}中像素值等于BFi,m(l1)的像素点的总个数。

A2、计算Si,m的离焦模糊特征图,记为{DBi,m(x,y)},其中,DBi,m(x,y)表示{DBi,m(x,y)}中坐标位置为(x,y)的像素点的像素值,DBi,m(x,y)=|R&times;r0Di,m(x0,y0)&times;(1-Di,m(x0,y0)Di,m(x,y))|,R表示人眼的瞳孔直径,在本实施例中取R=0.3厘米,r0表示人眼眼球的晶状体长度,在本实施例中取r0=0.16厘米,Di,m(x0,y0)表示人眼观看Si,m时会聚点(x0,y0)的深度值,会聚点(x0,y0)的位置根据现有的视觉显著性检测方法确定,Di,m(x,y)表示Si,m的深度图{Di,m(x,y)}中坐标位置为(x,y)的像素点的像素值,{Di,m(x,y)}可以由Si,m的左视点图像与右视点图像之间的视差图像{di,m(x,y)}转换得到,V表示观看者与显示器之间的距离,在本实施例中取V等于显示器的垂直高度的三倍,I表示人眼的瞳孔间距,在本实施例中取I=6.5厘米,Wx和Rx对应表示显示器的水平宽度和水平分辨率。

然后计算{DBi,m(x,y)}中的所有像素点的像素值的均值方差和熵值&mu;i,m(DB)=1H&times;W&Sigma;y=1H&Sigma;x=1WDBi.m(x,y),&upsi;i,m(DB)=1H&times;W&Sigma;y=1H&Sigma;x=1W(DBi,m(x,y)-&mu;i,m(DB))2,&eta;i,m(DB)=-&Sigma;l2=1k2p&lsqb;DBi,m(l2)&rsqb;ln(p&lsqb;DBi,m(l2)&rsqb;),其中,1≤l2≤k2,k2为{DBi,m(x,y)}中所包含的灰度级的总数目,DBi,m(l2)表示{DBi,m(x,y)}中的第l2个灰度级的灰度值,p[DBi,m(l2)]表示DBi,m(l2)在{DBi,m(x,y)}中出现的概率,表示{DBi,m(x,y)}中像素值等于DBi,m(l2)的像素点的总个数。

A3、采用现有技术计算Si,m的左视点图像的相位一致性图作为其空间频率特征图,记为{SFi,m(x,y)},其中,SFi,m(x,y)表示{SFi,m(x,y)}中坐标位置为(x,y)的像素点的像素值。

然后计算{SFi,m(x,y)}中的所有像素点的像素值的均值方差和熵值&mu;i,m(SF)=1H&times;W&Sigma;y=1H&Sigma;x=1WSFi.m(x,y),&upsi;i,m(SF)=1H&times;W&Sigma;y=1H&Sigma;x=1W(SFi,m(x,y)-&mu;i,m(SF))2,&eta;i,m(SF)=-&Sigma;l3=1k3p&lsqb;SFi,m(l3)&rsqb;ln(p&lsqb;SFi,m(l3)&rsqb;),其中,1≤l3≤k3,k3为{SFi,m(x,y)}中所包含的灰度级的总数目,SFi,m(l3)表示{SFi,m(x,y)}中的第l3个灰度级的灰度值,p[SFi,m(l3)]表示SFi,m(l3)在{SFi,m(x,y)}中出现的概率,表示{SFi,m(x,y)}中像素值等于SFi,m(l3)的像素点的总个数。

A4、从{φi,m(x,y)}中提取出四个与视觉舒适度相关的视差统计特征,分别为{φi,m(x,y)}中像素值最大的q%的像素点的像素值的均值χi,m、{φi,m(x,y)}中像素值最小的q%的像素点的像素值的均值κi,m、{φi,m(x,y)}的视差离差σi,m、{φi,m(x,y)}的视差偏斜度&chi;i,m=1Nqmax&Sigma;(x,y)&Theta;qmax&phi;i,m(x,y),&kappa;i,m=1Nqmin&Sigma;(x,y)&Theta;qmin&phi;i,m(x,y),&sigma;i,m=1H&times;W&Sigma;y=1H&Sigma;x=1W&lsqb;&phi;i,m(x,y)&rsqb;2,其中,1≤q≤50,在本实施例中取q=10,表示{φi,m(x,y)}中像素值最大的q%的像素点的总个数,表示{φi,m(x,y)}中像素值最大的q%的像素点的坐标位置构成的集合,表示{φi,m(x,y)}中像素值最小的q%的像素点的总个数,表示{φi,m(x,y)}中像素值最小的q%的像素点的坐标位置构成的集合。

A5、将χi,m、κi,m、σi,m按顺序进行排列构成Fi,m

①-3、采用现有的排序学习方法求解min(12||wT||22+&lambda;1&Sigma;&delta;12+&lambda;2&Sigma;&delta;22)s.t.wTFi,m-wTFi+1,n&GreaterEqual;1-&delta;1,&ForAll;i&Element;{1,2,3,4},&ForAll;m,n&Element;{1,2,...,M}|wTFi,m-wTFi,n|&le;&delta;2,&ForAll;i&Element;{1,2,3,4,5},&ForAll;m,n&Element;{1,2,...,M}&delta;1&GreaterEqual;0,&delta;2&GreaterEqual;0,得到最优的权值矢量,记为wopt,其中,min()为取最小值函数,w表示权值矢量,wT为w的转置矢量,符号“||||2”为矩阵的2-范数符号,λ1和λ2均为控制参数,在本实施例中取λ1=λ2=0.5,δ1和δ2均为误差参数,且δ1≠δ2,在本实施例中取δ1=0.15,δ2=0.08,s.t.表示“受约束于”,Fi+1,n表示由针对第i+1个视觉舒适度等级选取的M幅立体图像构成的集合Ci+1中的第n幅立体图像Si+1,n的用于反映视觉舒适度的特征矢量,符号表示“任意”,符号“||”为取绝对值符号,Fi,n表示Ci中的第n幅立体图像Si,n的用于反映视觉舒适度的特征矢量。

①-4、利用得到的最优的权值矢量wopt,构造视觉舒适度排序模型,记为f(F),f(F)=(wopt)TF,其中,f()为函数表示形式,F用于表示立体图像的用于反映视觉舒适度的特征矢量,且作为视觉舒适度排序模型的输入特征矢量,(wopt)T为wopt的转置矢量。

所述的测试阶段的具体步骤为:

②对于任意一幅测试立体图像Stest,按照步骤①-2的过程,以相同的操作获取Stest的用于反映视觉舒适度的特征矢量,记为Ftest;然后根据训练阶段构造的视觉舒适度排序模型f(F)=(wopt)TF,对Ftest进行测试,预测得到Ftest对应的排序值,将该排序值作为Stest的视觉舒适度客观评价预测值,记为Qtest

在此,Ftest的获取过程为:

B1、采用现有的基于光流的视差估计算法计算Stest的左视点图像与右视点图像之间的视差图像,记为{dtest(x′,y′)},其中,1≤x′≤W′,1≤y′≤H′,W′表示Stest的宽度,H′表示Stest的高度,dtest(x,y)表示{dtest(x,y)}中坐标位置为(x′,y′)的像素点的像素值。

然后采用现有的视差转换算法对{dtest(x′,y′)}进行视差转换,得到Stest的角视差图像,记为{φtest(x′,y′)},其中,φtest(x′,y′)表示{φtest(x′,y′)}中坐标位置为(x′,y′)的像素点的像素值,如果φtest(x′,y′)>0,则表示Stest中坐标位置为(x′,y′)的像素点在显示时成像在屏幕前,如果φtest(x′,y′)<0,则表示Stest中坐标位置为(x′,y′)的像素点在显示时成像在屏幕后,如果φtest(x′,y′)=0,则表示Stest中坐标位置为(x′,y′)的像素点在显示时恰好成像在屏幕上。

接着计算Stest的双目融合特征图,记为{BFtest(x′,y′)},其中,BFtest(x′,y′)表示{BFtest(x′,y′)}中坐标位置为(x′,y′)的像素点的像素值,

BFtest(x&prime;,y&prime;)=1,0&le;|&phi;test(x&prime;,y&prime;)|&le;|&theta;|exp(-(|&phi;test(x&prime;,y&prime;)|-|&theta;|)22&epsiv;2),|&phi;test(x&prime;,y&prime;)|>|&theta;|.

再计算{BFtest(x′,y′)}中的所有像素点的像素值的均值方差和熵值&mu;test(BF)=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;BFtest(x&prime;,y&prime;),&upsi;test(BF)=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;(BFtest(x&prime;,y&prime;)-&mu;test(BF))2,&eta;test(BF)=-&Sigma;l1&prime;=1k1&prime;p&lsqb;BFtest(l1&prime;)&rsqb;ln(p&lsqb;BFtest(l1&prime;)&rsqb;),1&le;l1&prime;&le;k1&prime;,k1′为{BFtest(x′,y′)}中所包含的灰度级的总数目,BFtest(l1′)表示{BFtest(x′,y′)}中的第l1′个灰度级的灰度值,p[BFtest(l1′)]表示BFtest(l1′)在{BFtest(x′,y′)}中出现的概率,表示{BFtest(x′,y′)}中像素值等于BFtest(l1′)的像素点的总个数。

B2、计算Stest的离焦模糊特征图,记为{DBtest(x′,y′)},其中,DBtest(x′,y′)表示{DBtest(x′,y′)}中坐标位置为(x′,y′)的像素点的像素值,DBtest(x&prime;,y&prime;)=|R&times;r0Dtest(x0,y0)&times;(1-Dtest(x0,y0)Dtest(x,y))|,Dtest(x0,y0)表示人眼观看Stest时会聚点(x0,y0)的深度值,会聚点(x0,y0)的位置根据现有的视觉显著性检测方法确定,Dtest(x′,y′)表示Stest的深度图{Dtest(x′,y′)}中坐标位置为(x′,y′)的像素点的像素值,{Dtest(x′,y′)}可以由Stest的左视点图像与右视点图像之间的视差图像{dtest(x′,y′)}转换得到,Dtest(x&prime;,y&prime;)=V1+I&times;Rxdtest(x&prime;,y&prime;)&times;Wx.

然后计算{DBtest(x′,y′)}中的所有像素点的像素值的均值方差和熵值&mu;test(DB)=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;DBtest(x&prime;,y&prime;),&upsi;test(DB)=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;(DBtest(x&prime;,y&prime;)-&mu;test(DB))2,&eta;test(DB)=-&Sigma;l2&prime;=1k2&prime;p&lsqb;DBtest(l2&prime;)&rsqb;ln(p&lsqb;DBtest(l2&prime;)&rsqb;),其中,1≤l2′≤k2′,k2′为{DBtest(x′,y′)}中所包含的灰度级的总数目,DBtest(l2′)表示{DBtest(x′,y′)}中的第l2′个灰度级的灰度值,p[DBtest(l2′)]表示DBtest(l2′)在{DBtest(x′,y′)}中出现的概率,表示{DBtest(x′,y′)}中像素值等于DBtest(l2′)的像素点的总个数。

B3、采用现有技术计算Stest的左视点图像的相位一致性图作为其空间频率特征图,记为{SFtest(x′,y′)},其中,SFtest(x′,y′)表示{SFtest(x′,y′)}中坐标位置为(x′,y′)的像素点的像素值。

然后计算{SFtest(x′,y′)}中的所有像素点的像素值的均值方差和熵值&mu;test(SF)=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;SFtest(x&prime;,y&prime;),&upsi;test(SF)=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;(SFtest(x&prime;,y&prime;)-&mu;test(SF))2,&eta;test(SF)=-&Sigma;l3&prime;=1k3&prime;p&lsqb;SFtest(l3&prime;)&rsqb;ln(p&lsqb;StFtest(l3&prime;)&rsqb;),其中,1≤l3′≤k3′,k3′为{SFtest(x′,y′)}中所包含的灰度级的总数目,SFtest(l3′)表示{SFtest(x′,y′)}中的第l3′个灰度级的灰度值,p[SFtest(l3′)]表示SFtest(l3′)在{SFtest(x′,y′)}中出现的概率,表示{SFtest(x′,y′)}中像素值等于SFtest(l3′)的像素点的总个数。

B4、从{φtest(x′,y′)}中提取出四个与视觉舒适度相关的视差统计特征,分别为{φtest(x′,y′)}中像素值最大的q%的像素点的像素值的均值χtest、{φtest(x′,y′)}中像素值最小的q%的像素点的像素值的均值κtest、{φtest(x′,y′)}的视差离差σtest、{φtest(x′,y′)}的视差偏斜度&chi;test=1N&prime;qmax&Sigma;(x&prime;,y&prime;)&Theta;&prime;qmax&phi;test(x&prime;,y&prime;),&kappa;test=1N&prime;qmin&Sigma;(x&prime;,y&prime;)&Theta;&prime;qmin&phi;test(x&prime;,y&prime;),&sigma;test=1H&prime;&times;W&prime;&Sigma;y&prime;=1H&prime;&Sigma;x&prime;=1W&prime;&lsqb;&phi;test(x&prime;,y&prime;)&rsqb;2,其中,表示{φtest(x′,y′)}中像素值最大的q%的像素点的总个数,表示{φtest(x′,y′)}中像素值最大的q%的像素点的坐标位置构成的集合,表示{φtest(x′,y′)}中像素值最小的q%的像素点的总个数,表示{φtest(x′,y′)}中像素值最小的q%的像素点的坐标位置构成的集合。

B5、将χtest、κtest、σtest按顺序进行排列构成Ftest

在本实施例中,采用宁波大学建立的立体图像数据库中剩下的150幅立体图像作为测试立体图像,该立体图像数据库包含立体图像以及对应的视差图像,该立体图像数据库包含了各种场景深度的室内和室外图像,并给出了每幅立体图像的视觉舒适度的平均主观评分均值。利用评估图像质量评价方法的4个常用客观参量作为评价指标,即非线性回归条件下的Pearson线性相关系数(Pearsonlinearcorrelationcoefficient,PLCC)、Spearman秩等级相关系数(Spearmanrankordercorrelationcoefficient,SROCC)、Kendall秩等级相关系数(Kendallrank-ordercorrelationcoefficient,KROCC)、均方根误差(Rootmeansquarederror,RMSE),PLCC和RMSE反映客观评价预测值的准确性,SROCC和KROCC反映其单调性。将利用本发明方法计算得到的150幅立体图像各自的视觉舒适度客观评价预测值做五参数Logistic函数非线性拟合,PLCC、SROCC和KROCC值越高、RMSE值越小说明本发明方法的评价结果与视觉舒适度的平均主观评分均值的相关性越好。表1给出了采用不同舒适度特征组合得到的视觉舒适度客观评价预测值与视觉舒适度的平均主观评分均值之间的相关性,从表1中可以看出,只采用部分特征组合得到的视觉舒适度客观评价预测值与视觉舒适度的平均主观评分均值之间的相关性并不是最优的,这说明了本发明方法提取的特征信息是有效的,同时也说明了本发明方法建立的基于排序学习的视觉舒适度排序模型是准确的,使得得到的视觉舒适度客观评价预测值与视觉舒适度的平均主观评分均值之间的相关性更强,这足以说明本发明方法是可行且有效的。

表1采用不同特征组合得到的视觉舒适度客观评价预测值与视觉舒适度的平均主观评分均值之间的相关性

上述表1中,F1代表第1种特征组合情况下立体图像的特征矢量,F1由立体图像的双目融合特征图中的所有像素点的像素值的均值μ(BF)、方差υ(BF)和熵值η(BF)构成;F2代表第2种特征组合情况下立体图像的特征矢量,F2由立体图像的离焦模糊特征图中的所有像素点的像素值的均值μ(DB)、方差υ(DB)和熵值η(DB)构成;F3代表第3种特征组合情况下立体图像的特征矢量,F3由立体图像的左视点图像的空间频率特征图中的所有像素点的像素值的均值μ(SF)、方差υ(SF)和熵值η(SF)构成;F4代表第4种特征组合情况下立体图像的特征矢量,F4由立体图像的角视差图像中像素值最大的q%的像素点的像素值的均值χ、立体图像的角视差图像中像素值最小的q%的像素点的像素值的均值κ、立体图像的角视差图像的视差离差σ和立体图像的角视差图像的视差偏斜度构成;F代表利用本发明方法得到的立体图像的特征矢量。

专 / 利 / 交 / 易 / 流 / 程

安 / 全 / 保 / 障

  • 确保每个项目方信息真实有效;
  • 提供全程贴身服务,专业客服人员全程跟进对接环节;
  • 提供专业的技术交易咨询服务,协助完成签约交易;
  • 提供资金担保服务,确保买方资金安全;
  • 提供交易订单存证数据,协助处理技术交易纠纷。

专 / 利 / 交 / 易 / 常 / 见 / 问 / 题

1、在赋翼网没有找到自己需要的专利怎么办?

答:如果在网站没有找到须要的专利,可联系客服提交自己的需求,工作人员会在十分钟内检索全网专利库,给满意的答复。

2、在赋翼网购买专利安全吗?

答:赋翼网所出售专利均经专利权人本人核实,专利真实有效,请放心购买。

3、购买专利是一次性收费吗? 还有其他的费用吗?

答:在赋翼网购买专利,均为一次性收费(办理期间客户另提其他要求除外)。

4、购买后多久能收到专利证书?

答:跟赋翼网签订合作合同后,工作人员会立刻办理进行手续办理,买专利最快7天下证(根据办理速度不同,具体下证时间以国家知识产权局实际为准)。

5、购买后变更失败怎么办?

答:如遇到付款后未能按照合同约定变更专利权人(含合同约定任何一项没有做到),经核实后赋翼网将在2个工作日内全额退款。

—— 购买专利 ——

信息保护中,请放心填写

推 荐 专 利 更多