ISSN: 2321 - 6204
Bezuayehu Gutema Asefa*
食品科学与营养研究,埃塞俄比亚农业研究所Sebeta,埃塞俄比亚
收到:26日- 2022年7月,手稿。jfpdt - 22 - 70301;编辑分配:自2022年7月28 -,PreQC没有。jfpdt - 22 - 70301 (PQ);综述:11 - 8月- 2022,质量控制。jfpdt - 22 - 70301;修改后:05 - 10月- 2022手稿。jfpdt - 22 - 70301 (R);发表:12 - 10月- 2022,2321 - 6204.10.6.001 DOI: 10.4172 /
访问更多的相关文章研究和评论:食品和乳品雷竞技苹果下载技术杂志》上
一个快速方法基于数字图像分析和机器学习技术提出了与水牛奶掺假的检测。几个机器学习算法相比,支持向量机进行最好的89.48%的准确性和精度95.10%。提高分类性能在极端的类。更好的定量测定添加水是用SVMR R2(CV)和R2(P)分别为0.65和0.71。该技术可用于无损测定牛奶掺假和水没有任何额外的试剂的必要性。
牛奶掺假;多元分类;支持向量机;验证;数字图像分析
有很高的营养价值,提供营养素(蛋白质,脂肪和矿物质)和微量元素(维生素和微量元素),牛奶是公认的贡献者许多人口的均衡饮食。由于高营养成分,高速率的牛奶消费的全球需求增长存在(1]。尽管牛奶粮食和营养安全的作用,增加的需求放大欺诈活动,随后让牛奶掺假(第二个最脆弱的产品2]。
牛奶掺假可以用水稀释,目的提高经济收益或添加物质(如蔗糖、氯化钠、植物油和表面活性剂),提高牛奶的理化和视觉特征(3]。此外,添加物质,延长保质期的牛奶,如甲醛、过氧化氢和次氯酸盐已经成为一个严重掺假乳制品行业的问题。
评估在牛奶掺假的患病率在好几个国家发现水是最常添加添加剂。水被添加到发展经济收益增加的体积通过稀释牛奶。然而,添加水牛奶稀释牛奶的成分和可能导致潜在的公共卫生风险的急性营养不良(发育不良,浪费和体重不足),导致营养有关的儿童死亡率。据专家们说,让农民了解牛奶欺诈行为的后果,需要改进的检测是关键解决牛奶中盛行的欺诈风险。几项研究已经显示的可能性决定水的存在作为掺杂物在牛奶样品使用不同的技术。新发展的技术,是健壮的,绿色,简单和成本有效的获得越来越多的重要性在食品质量监控(4]。
基于数字图像的过程,利用机器学习算法的力量正越来越多地用于评估在农业食品包括牛奶掺假。近年来,一些研究发展进行了数字图像技术测定牛奶中掺杂物。然而,新开发的技术缺乏代表性抽样成像期间的牛奶样品。例如,化学指标被用来把所需的分类结果在成像的过程。这将限制在利用这些技术由于用户的方法是需要技术知识的过程。
考虑到现有方法的局限性,提出了一种基于数字图像处理的清洁方法,加上机器学习算法测试与水牛奶掺假。提出的方法是快速、健壮且不需要样品制备包括使用任何化学物质5]。
牛奶样品
原料奶样本来自两个不同的奶牛场Sebeta和德勃雷时间农业研究中心的埃塞俄比亚农业研究所(EIAR)。选择已知研究奶牛场,确保牛奶在飙升掺杂物的纯度。一批牛奶被用来获取图像的纯牛奶和修改牛奶与水作为掺杂物的范围从10到40%。由于图像采集中执行抽样地点,研究中使用的所有牛奶样品冷藏和运输超过一公里。为每个图像采集牛奶样品的体积保持不变在25毫升,这是定量转移到培养皿中获取图像从上表面。掺假的牛奶样品被飙升模拟水在整个样本中使用一天,以避免由于强化个体样本图像强度的差异。
图像采集
传统图像采集室有一个尺寸L x W x H (40 x 40 60),由使用铝片。均匀照明维护使用十二荧光成像室的肿块安装四个面底部表面以上高40厘米。数码相机(EOS, 6 d Mark II,佳能、日本)安装一个图像稳定器的24 - 105 mm的顶部设置图像采集室走到培养皿中含有牛奶样品的高度约55厘米。图像采集的过程中完全监控使用EOS实用工具软件。50个样本准备每个样本组的两个抽样地点。每个样本的形象被一式两份,总共二百张图片为每个组的样本(6]。
特征提取
从所有样本获得的图像处理中使用一个批处理程序图1。所有捕获的图像处理全球处理阶段,需要从大量图像感兴趣的地区。每个图像的中心区域出现的250 x 250像素大小。不同颜色空间转换等进一步处理(实验室*和HSI)和过滤进行了总结表1。均值和模态灰值,最小和最大灰色值,标准差、平均和质心计算每个图像处理。计算处理后图像参数,一些值显示在“-”符号表1发现无关紧要,不包括作为一个预测变量由于对所有样本组也获得了类似的输出值。完全,包括125个变量作为多元发展的预测模型。
图像过程描述 | 测量参数 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
平均灰度值 | 标准偏差 | 模态灰度值 | 平均灰度值 | 最小灰度值 | 最大灰度值 | 质心(X最大值) | 质心(Y最大) | 偏态 | 峰度 | |
调整(250 x 250像素) | + | + | + | + | + | + | + | + | + | + |
过滤(高斯) | + | + | + | + | + | + | + | + | + | + |
过滤(中位数) | + | + | + | + | + | + | + | + | + | + |
过滤(Kwahara) | + | + | + | + | + | + | + | + | + | + |
过滤(FFT) | + | + | + | + | - - - - - - | - - - - - - | + | + | + | + |
过滤(卷) | + | + | - - - - - - | - - - - - - | - - - - - - | + | + | + | + | + |
分裂RGB(右) | + | + | + | + | + | + | + | + | + | + |
分裂RGB (G) | + | + | + | + | + | + | + | + | + | + |
分裂RGB (B) | + | + | + | + | + | + | + | + | + | + |
转化为HSI (H) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - |
转化为HSI (S) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - |
转化为HSI(我) | + | + | + | + | + | + | + | + | + | + |
转换为实验室*(左) | + | + | + | + | + | + | + | + | + | + |
转换为实验室* (*) | + | + | + | + | + | + | + | + | + | + |
转换为实验室* (b *) | + | + | + | + | + | + | + | + | + | + |
图像处理的描述:“+”符号表示参数作为变量,而“-”符号引用参数被排除的变量列表。
表1。图像处理的描述和参数作为一个变量分类模型的发展。
多变量过程
数值处理产生的图像被用于开发分类和回归模型的基础上,添加水变成纯牛奶。多变量过程进行了使用MATLAB软件(R2020b,请工具箱,特征向量)。特征在当前的研究中使用的不同的多变量过程的简要描述表2。
算法 | 描述 |
---|---|
再(事例) | 基于事例的分类识别未知的对象之间的距离和训练集的每个对象的主要是基于欧氏距离。决定基于多数决定原则后再选择对象的未知样本。 |
软独立建模的类类比(SIMCA) | SIMCA计算主成分模型和几何距离确定类的距离。此外,确定建模和歧视性的权力。 |
支持向量机(SVM) | 基于支持向量机的分类原理是获得最优的边界向量空间中的两类独立训练向量的概率分布的数据集。 |
偏最小二乘判别分析(PLS-DA) | 请基于分类的作品找到组件输入矩阵(X)中描述的相关变化最多的输入变量和与目标有最大的关联值Y。 |
表2。摘要机器学习算法用于分类的任务。
模型性能评估
每个模型的性能是使用总精度评估方法计算使用真阳性(TP)和真阴性(TN)混淆矩阵中获取的值(方程1)。此外,精度(公式2)召回(公式3)计算基于假阴性(FN)和假阳性(FP)值支持分类模型的有效性。
精度= TP / (TP + FN) (1)
精度= TP / (TP + FP) (2)
回忆= TP / (TP + FN) (3)
探索性分析
共有25个预测变量从900图像数据(即。180 x 5组)从excel文件检查视觉识别潜在的离群值。根据观察,29日图像数据被删除,而剩下的871图像数据被用来建立分类模型。分析之前,Kenard石技术采用随机独立的80%的数据训练集,其余20%为测试集。变化特性的影响大小是由自动定量修正预测变量(7- - - - - -10]。
主成分分析(PCA)是应用于降低数据维数和新变量的线性组合生成的原始图像的特征值。选择一个最优数量的电脑做了基于交叉验证最低的预测误差(百叶窗)。前三个电脑解释75%以上的数据方差所示三维PCA score-plot获得三个电脑(图1)。颜色的变化从score-plot强度可以观察到。水添加量增加可能与图像的颜色密度递减分数在PC减少1中所示。因为牛奶颜色的影响成分,添加水纯牛奶会影响强度。检测这种细微的差别在牛奶使用人眼颜色的强度可能是困难的,除非使用数字技术与数值软件的支持。
多元分类
结果表显示每个分类算法的性能表3。的四个分类算法,SIMCA最糟糕的表现提供了不到60%的总精度在训练数据集。SIMCA旁边,可怜的分类性能与PLSDA算法获得。这两个分类器相比,资讯和支持向量机实现公平分类总精度分别为79.45和89.48。SVM通常取得卓越的成果相比,分类器的准确率达到了89.48%,95.10%的精度,83.24%召回值。
算法 | 性能的措施 | 训练集 | 交叉验证设置 | 测试组 |
---|---|---|---|---|
然而, | 精度 | 79.43 | 81.78 | 79.45 |
精度 | 89.22 | 90.35 | 88.46 | |
回忆 | 67.16 | 71.12 | 67.59 | |
支持向量机 | 精度 | One hundred. | 86.47 | 89.48 |
精度 | One hundred. | 93.38 | 95.1 | |
回忆 | One hundred. | 78.58 | 83.24 | |
PLS-DA | 精度 | 66.94 | 66.12 | 66.97 |
精度 | 75.91 | 74.39 | 75.98 | |
回忆 | 48.07 | 46.72 | 47.9 | |
SIMCA | 精度 | 58.49 | ||
精度 | 41.5 | |||
回忆 | 87.12 |
表3。不同的分类算法的性能措施培训,交叉验证和预测数据集。
进一步分析每个类模型的预测性能的样品表现出高效的分类支持向量机算法的性能在极端类(表4)。这意味着没有掺假的牛奶样品添加水和牛奶样品,40%与更好的分类性能比其他样本。正确识别纯牛奶样品使用相同的算法实现了在预测集样品的准确性达91.95%。同时,支持向量机的分类精度最高(92.04)牛奶样品中掺入40%的水分。
算法 | M: W | 培训 | 交叉验证 | 测试 |
---|---|---|---|---|
然而, | 0% | 81.91 | 81.95 | 78.04 |
10% | 78.13 | 79.93 | 79.38 | |
20% | 76.75 | 80.85 | 78.59 | |
30% | 76.43 | 77.88 | 72.04 | |
40% | 83.95 | 88.28 | 89.19 | |
PLS-DA | 0% | 63.98 | 63.75 | 68.74 |
10% | 67.13 | 66.56 | 67.57 | |
20% | 58.31 | 56.58 | 62.73 | |
30% | 56.94 | 55.82 | 55.48 | |
40% | 88.37 | 87.88 | 80.35 | |
支持向量机 | 0% | One hundred. | 87.07 | 91.95 |
10% | One hundred. | 85.27 | 88.26 | |
20% | One hundred. | 84.72 | 88.99 | |
30% | One hundred. | 82.82 | 86.18 | |
40% | One hundred. | 92.47 | 92.04 |
表4。性能措施类预测资讯,PLS-DA和SVM算法。
这个结果比先前由Kobek开发过程,发现总分类精度81.66使用基于人工神经网络(ANN)的分类模型。在另一个研究Poliana, et al。SIMCA和资讯分类算法应用于区分牛奶掺入水和纯牛奶,和总精度分别为82和92% SIMCA和资讯被发现。然而,化学指标被用来带来期望的颜色变化在两种结果考虑到这些事实,我们的发现验证了使用数字图像来确定牛奶掺假的可能性与水不添加化学指标的必要性(11]。
掺假的水平估计
数据集也开发预测模型用于掺假的水平(12- - - - - -14]。的预测性能偏最小二乘回归(PLSR)、主成分回归(PCR)和SVMR算法评估。摘要提出了定量预测性能的措施表5。
不。 | 方法 | 进行预处理 | LV /电脑 | RMSEC | RMSECV | R2(卡尔) | R2(简历) | R2(P) |
---|---|---|---|---|---|---|---|---|
1 | 聚合酶链反应 | > > | 3 | 11.23 | 11.28 | 0.31 | 0.3 | 0.16 |
2 | PLSR | > > | 6 | 9.84 | 10.05 | 0.47 | 0.44 | 0.44 |
3 | SVMR | > > | 4.93 | 8.02 | 0.87 | 0.65 | 0.71 |
表5所示。绩效指标的回归模型为定量掺杂物开发的预测。
除了SVMR算法,预测性能不足被发现在预测水掺假水平为0.16,0.44和0.52的预测R2分别在PCR, PLSR和高钙。有趣的是,SVMR实现更好的性能在预测掺假的牛奶样品的水的数量与R2(CV)和R2(P)分别为0.65和0.71 (15]。
颜色的变化由于被水稀释的牛奶已经证明是有用的检测掺假通过使用图像加上机器学习算法进行处理。支持向量机分类模型歧视牛奶样品水平的基础上添加水准确度和精密度为89.48%和95.10%,分别。该技术可用于无损测定牛奶掺假和水没有任何额外的试剂的必要性。
作者要感谢埃塞俄比亚农业研究所的研究提供必要的设施进行研究。
(Crossref][Googlescholar][索引]
(Crossref][Googlescholar][索引]
(Crossref][Googlescholar][索引]
(Crossref][Googlescholar][索引]
(Googlescholar][索引]
(Googlescholar][索引]
(Crossref][Googlescholar][索引]
(Crossref][Googlescholar][索引]
(Googlescholar][索引]
(Crossref][Googlescholar][索引]