所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

加速视频帧分类基于度量的场景分割

亚当角斗士,Jan Cychnerski亚当Brzeski
计算机体系结构、Gda´精工科技大学,波兰
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

本文解决的问题有效分类的图像视频的情况下,在所有的视频标记。实现连续帧的相似性,我们引入一组简单的指标来测量这种相似性。使用这些观察的数量减少必要的分类,我们提出一个场景分割算法。进行实验评估收购现场尺寸和分类精度造成的使用不同的相似性度量算法。因此,我们已经确定这些指标的考虑,这在场景分割显示最好的使用特点。



关键字

场景分割,图像距离,图像分类

介绍

医学成像技术看到持续改进等新的视频数据采集的发展
方法(如无线胶囊内窥镜——WCE[1])和加速度恒定的处理获得的数据。在
这些字段有许多相关问题收集和处理大量的视频数据。例如,一个
单一WCE视频可达8 h的时间长,需要2-3h医学专家研究[2]。
取决于特定的应用程序,它可能被要求提供关于整个视频的一般结论
或详细分析每个单独的帧。前者与诊断,最重要的
信息是病人是否有内部流血或病变,以及任何额外的信息。
后一种情况可能是在创建数据库时图像识别算法或教育的目的
当最终用户(这里:一个人或算法)作用于各种图片,比较例疾病和健康
组织。
在现实生活的视频,尤其是保证足够高的帧速率,连续帧非常相似
现在只是小修改相邻帧。在医学应用中这意味着记录流
被视为是“连续”[3],对象逐渐进入和离开现场[4]。
视频的连续字符允许考虑场景[5]——一个部门短序列相似的框架,
分享一个给定的标签。方法寻找这样的分歧已经开发特别是真人电影[6],[7],
场景和镜头变化即时快速变化,明显更容易点的框架特征。
在医学成像一个受欢迎的方法包括检测特征或特定帧收购
视频摘要[8],[9],[10],[11]。这些帧直接代表社区,与隐式
认为变化之间的场景。
视频的变化的速度是衡量指标指定连续帧的相对差异。
这样的功能和它们的属性被定义在第二节。
在本文中,我们将评估的结果一个新场景分割算法将三个选择
指标与不同的参数设置。执行评估的最终分类的准确性
所有场景作为一个整体。整个过程一直在第三部分进一步描述,而可以找到它的结果
在第四节。

预赛

答:图像指标
确定两帧和多视图视频不同的变化,比较的功能
框架必须被定义。这些功能将进一步被称为指标。我们的定义1的指标d需要它
满足以下属性:
图像(1)
图像(2)
图像(3)
图像(4)
在考虑使用度量的价值预计将以某种方式量化图像的视觉相似性。
上面的定义允许任何非负的度量值。不过,值得注意的是所有可能的集合
图片仍然finite2,这意味着存在一个上限M图像的距离。为一个更简单的
比较和评价的度量值是线性归一化范围(0;1)(除以的价值
指标由上界M考虑图像大小)。
对于我们的目的,我们选择考虑以下指标:
•简单距离(SD) - l1的图像之间的距离(像素值的向量)
•简单的距离图像处理(SP)——后两张图片的简单的距离模糊和缩小规模
•直方图距离与k垃圾箱(高清,HDk) - l1 k-bin HSV彩色直方图的图像之间的距离。
图像
1严格来说,在图像空间中定义伪度量提出条件,因为它是可能的d(一个;b) = 0 6 = b。
认为功能是适当的距离函数只处理向量获得为每个度量定义。
2的所有可能的像素值对于一个给定的分辨率和颜色深度是有限的。
b .算法
在本节中,我们提出一个简单的场景分割算法(大部分)连续视频。为每一个场景
选择一个特定的框架定义它。接下来,这个场景中创建两个主要步骤:
扩张——连续帧被分配到现场,直到达到一个框架的区别
具体的框架超过给定的阈值。这个框架将是下一个特定的框架。
减少——从当前场景的结束帧,它更类似于下一个特定的框架
当前一个重新分配到下一个场景。
算法的伪代码已经提出了算法1(完全对治疗一些边界
例)。

实验

执行实验涉及的评估算法从内镜组的录音
考试。六个具有代表性的电影已被选定,满足以下标准:
至少1000帧长
公认的属性出现在20%到80%之间的帧
至少有5个视频识别状态的变化
这些要求已设置防止过高估值算法只在所有框架和传播一个结果
评估算法在罕见的“混乱”的视频。
场景分割算法被应用到每一个电影与五种不同的指标,使用阈值
列在表i不同阈值集的结果指标的不同特点,SD和SP
显示出更大的价值的变化。

结果

第一个观察评价是相对较高的距离在SD和SP指标看似相似
图像。这个观察有关这两个指标是敏感,哪怕是轻微的变化,允许检测
图像与一个非常高的常见的静态区域。
对各种检测阈值的平均场景长度计算和结果展示在表二世
和表3。正如预期的那样,一个明确的正相关阈值和场景之间的长度可以看到
指标。
图1给出了识别准确性和度量阈值的关系。可以看到一个负相关
这两个值之间。H8度量结果,得到了香港最好的结果指标,表明25%的接受变化可能的距离(或:增加六倍的数量差异)的变化
不到10%的准确性。
因为不同的阈值检测两组指标,重要的是要注意,值
两组之间在这个图没有可比性。
图2中的图表呈现之间的关系获得平均场景大小和由此产生的分类
准确性。可以看出,所有的香港指标获得相似的结果和表现SD和SP指标。
这表明的场景分割算法获得一个更好的部门到场景和香港指标
分配他们的特定的帧。
高精度值超过95%保存场景的大小6帧。这样的结果。昂贵的
识别算法可以改进操作整个场景,一个场景分割算法调优
对给定的时间限制取决于一种公认的性能/准确性权衡。

总结

本文新方法加速在视频序列帧的分类显示。保存
可靠性高,处理的帧数的分类算法可以减少的一个因素
80%。三种通用的指标评估,基于HSV直方图与shift-insensitive指标
执行简单的图像距离。
广泛的可能的指标定义和参数化留下一个开放空间进行进一步的实验
这个主题。

表乍一看

表的图标 表的图标 表的图标
表1 表2 表3

数据乍一看

图1 图2
图1 图2

引用












全球技术峰会