所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

效率的比较选择内窥镜视频分析算法

Jan Cychnerski
计算机体系结构、Gda´精工科技大学,波兰
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

本文选择图像分析算法检测和识别信息帧的任务相比,模糊的框架,在内窥镜视频大肠癌组织和健康组织。为了规范测试,算法从他们被删除修改部分负责分类,,代之以支持向量机和人工神经网络。执行的测试是在一个统一的方式在一个共同的、大型的电影数据库的内窥镜视频。测试结果通常不似乎证实了作者声明的效率高。最多80%的敏感性和特异性,尽管作者经常宣布高达90%。

关键字

内窥镜检查、视频分析、算法比较,效率

介绍

自去年的几年中,内窥镜电影分析算法(胃镜检查、结肠镜检查和无线胶囊内窥镜WCE)获得声望。这些算法是为识别信息和noninformative框架,以及各种疾病或健康的组织。算法在文献中发现是由它们的作者声称给高性能(精度、灵敏度、特异性等)[1]的结果。然而,出版物的缺陷往往是缺乏比较不同算法的测试(或缺乏任何比较)。这种情况的原因之一是缺乏一个良好的公共医疗准备胃肠内镜图像算法的数据库测试。
本文主要关注比较选择内窥镜图像分析算法。允许比较分析,有必要建立常见算法的操作条件。算法修改统一他们的操作,然后进行比较试验在相同的数据集,测量算法的性能检测信息和欠框架,结肠直肠癌和正常组织。

算法

在这篇文章中,选择图像分析算法进行了测试和比较,如表我。

测试程序

算法比较在两个主要任务:效率区分癌症(a)和大肠的正常组织,和(b)信息/欠(例如内窥镜的运动所扭曲,可怜的照明、液体覆盖的相机内窥镜,等等)。
为了这个目的,所有测试一个共同的数据库上进行真正的结肠内窥镜视频[2]。统一算法的操作,负责部分分类被删除,只留下核心-特征向量提取。所有特征向量也归一化,这样每一个功能都有0的均值和标准偏差1在整个数据库。分类、人工神经网络(ANN)和支持向量机(SVM)被用来测试算法的效率(所有分类器训练和测试相同的方式在相同的数据)。
的数据库进行分类器训练[1]内窥镜内窥镜视频,完全标签由一个专家对每一帧的内容。专家给了每一个视频的每一帧三种标签:[模糊],[锋利,癌症]或锋利的,健康的。由于视频的不同长度和不同比例的标签,从每个电影最多30帧(可能远离彼此)被选为每个标签进行进一步的处理。Total number of selected frames was  4750 for blur recognition and  2750 for cancer recognition.
执行的测试是两种主要类型:(a)确定明确的(信息)/模糊(欠)框架,和(b)识别健康/癌组织。对于每个测试类型,输入数据分为八组,保存类的比例,因此,图像的一个病人总是被放置在同一组(组分配执行中描述的算法[19])。这样设置平衡建议在医学研究[1]。
交叉验证集被用来准备8倍。对于每一个分类器,设置的参数被选中,然后是由最优化算法从NLopt图书馆CRS[17][18], 8小时的时间限制(通常导致5000 - 50000算法的迭代)。在测试期间,效率参数测量:
1)敏感性——表现在认识到积极的样本
2)特异性,表现在识别负样本
3)精度-表现给予正确的答案
4)光滑,光滑的分类器的输出[20]
5)总体得分加权调和平均数的敏感性,特异性和平滑度值

结果

本节包含所有测试算法的测试结果。执行的测试以同样的方式,在相同的硬件上,在相同的条件下,相同的数据(如前一节所述)。
表II - III和图1 - 2的结果识别模糊/清楚(信息/欠)帧与人工神经网络和支持向量机。在这个任务中,神经网络表现明显优于SVM。结果是相对一致的预期和作者的描述原始出版物(如果存在)。测试算法比其他的表现更糟。在模糊的帧识别的任务,最好的算法是:BaoupuLi, MB-LBP-C,科多兽,LCVP。
表4 - V和图3 - 4现在承认结肠直肠癌的结果/正常组织,安和支持向量机。在这个任务中,神经网络的表现也比支持向量机,虽然不像在模糊识别清楚。
测试算法也表现通常比大多数其他算法。在确定癌组织的任务,最好的算法是:BaoupuLi, MB-LBP-C, LCVP, DFT-HT,出去。然而,这些结果远低于原始出版物的作者宣称的功效(通常超过90%)[1]。

结论

在这篇文章中,选择内窥镜图像算法进行了测试和比较模糊和清晰的检测任务(信息/欠)框架,结直肠癌和健康的结肠。测试执行大型内窥镜视频数据库,在同等条件下对所有算法。认识到疾病的效率显然不同于作者所宣称的。在模糊识别的任务,算法执行同样(或略好)。
这些结果表明需要更多的比较在内窥镜图像分析领域的测试。这些测试应该执行在一个共享数据库,以同样的方式。前面的方法作者在这一领域,包括只在自己的(通常是小)测试数据集似乎是不够的。

表乍一看

表的图标 表的图标 表的图标 表的图标 表的图标
表1 表2 表3 表4 表5

数据乍一看

图1 图2 图3 图4
图1 图2 图3 图4

引用






















全球技术峰会