所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

Partitional聚类分析方法对非线性混合动力系统

迪帕克Ankit k . Shah1 Adhyaru2
  1. 仪表与控制系助理教授,SardarVallabhbhai帕特尔理工学院(SVIT) Vasad,印度古吉拉特邦1
  2. 节头、仪表与控制系Nirma大学艾哈迈达巴德,古吉拉特邦,India2
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

非线性混合动力系统(区域)的特点是连续和离散域的动态交互。应用系统据报道在化学系统、制造系统、机械系统、电气系统、通信系统、汽车控制和计算机磁盘驱动器控制。非线性连续动态区域将会改变由于一些未知的离散事件的发生。识别的区域,应分类开环数据根据离散事件。聚类是将对象组织到组织成员的过程在某种程度上是相似的。最近出现了各种各样的算法,满足这些需求,并成功地应用于现实生活的数据挖掘问题。模糊cmeans (FCM)和k - means partitional常用算法是基于无监督学习方法。本文在分析FCM和k - means partitional聚类方法对单坦克区域数据分类。

关键字

非线性混合动力系统;聚类;模糊c均值;k - means。

介绍

经典控制理论利用模型的动态系统,其状态进化是由平滑线性或非线性微分方程描述。然而,许多动力系统周围还取决于出现的离散事件与连续的进化动力状态[1]。交互系统的特点是连续时间非线性动力学和离散事件动态被称为非线性混合动力系统(区域)。当连续和离散元素一起工作在一个过程,有一个相当大的这些元素之间的关系,有必要对模型动态元素。这就是为什么在最近,许多研究人员集中他们的努力对混合动力系统建模与控制[2,3]。
这种混合动力系统的应用在化学已报告系统、制造系统,机械系统[4]、电信系统、汽车控制和计算机磁盘驱动器控制等等。因此,混合动力系统产生大量的应用领域,但这种混合动力系统的控制往往是基于启发式造成工厂操作。几个策略模型的混合动力系统正式积分连续和离散变量提出了文献[1 - 3]。等模式识别结合动力系统,应根据离散事件的信息进行分类。(5 - 10),不同的基于聚类的数据分类算法用于混合动力系统。聚类是数据组织到组织成员的过程在某种程度上是相似的[11]。集群数据可以在形式的图像、购物项目,模式,观察,特征向量,话说,文档,购物物品等。我们的目标是将先于这样对象属于同一个集群尽可能相似,而属于不同簇的对象尽可能不同。聚类是数据挖掘的一个重要组成部分,探索和分析大量数据的过程为了得到有用的信息。聚类的无监督分类模式分成组[12]。在一个无监督分类的问题,没有预定义的类给出但数据对象或个人应该形成一个数量的团体,这样两个对象之间的距离在一组应该相对较小,这些不同组之间应该相对较大。只有一些数学标准可以决定在集群的构成自动分类数据集。 Therefore clustering methods are endowed with distance functions that measure the dissimilarity of presented example cases, which is equivalent to measuring their similarity. As a result one yields a partition of the data-set into clusters regarding the chosen dissimilarity relation. Clustering approach can used for the data mining, text mining, information retrieval, web analysis, marketing, medical diagnostics, computational biology and many other applications. A variety of algorithms have recently emerged that meet these requirements and were successfully applied to real-life data mining problem [13]. In general clustering algorithms can be classified in to two categories: Hierarchical algorithms and Partitional algorithms.Hierarchical clustering algorithms produce a nested series of partitions based on a criterion for merging or splitting clusters based on similarity. Partitional clustering algorithms identify the partition that optimizes (usually locally) a clustering criterion [11]. Partitional methods have advantages in applications involving large data sets for which the construction of a dendrogram is computationally prohibitive. A problem accompanying the use of a partitional algorithm is the choice of the number of desired output clusters must be specified. The partitional techniques usually produce clusters by optimizing a criterion function defined either locally or globally. Partitional clustering algorithm mainly classified in to two kinds: k-means and fuzzy c-means algorithms.
清爽的k - means聚类方法划分,每一个给定对象严格分为一个组(14、15)。k - means聚类方法是高效的用于处理大型数据集。为对象定义的界限非常犀利,所以被划分在一个且只有一个集群。各种基于改进的k - means聚类算法也提出了(16、17)。模糊逻辑是模糊集的逻辑;一个模糊集,潜在的无限范围的真值1和0之间。在模糊逻辑命题一定程度的真理和加入模糊集可以完全包容,完全排斥,或某种程度上。模糊集是不同于一组脆,它允许元素有一个隶属程度[18]。模糊集的核心是它的隶属函数。它是一个函数定义了集值的关系域和模糊集合的隶属程度。模糊c均值(FCM)聚类算法允许一块数据属于两个或两个以上的集群。 This method developed by [19] and further improved by [20, 21], is frequently used in pattern recognition [20, 22].
区域数据集包含两个数字的和定值连续动态的,所以我们感兴趣的是算法,有效地提供分区数据集的混合动力系统。本文的目的是分析效率的k - means算法和FCM partitional集群为混合动力系统分类数据根据离散事件。论文的结构如下。数据分类的努力k - means聚类算法无监督数据提出了第二节。非监督分类数据的模糊c均值聚类算法提出了第三节。在第四部分,数据分类的例子使用k - means随机数据集和模糊c均值算法。第五节提供了应用程序的k - means算法和模糊cmeans单槽区域的分类。最后,第六节总结了partitional聚类分析方法对混合动力系统数据分类和给未来这一分析的范围。

k - means聚类算法

k - means聚类算法称为硬分区算法接近最大似然解确定的位置的混合物的密度组件密度。对象是集群用k, k是集群的数量。缩写符号C = (c1,…, ck)用于集群中心的完整集合。给定一组n个观察值的p-dimensional欧几里得空间,k - means聚类的目标是分区的n个观察值在k组(k < n),以减少within-Cluster平方和(wcs)。k - means聚类的目标函数可以定义为(16、17):
图像(1)
,ci是点的意思是第i个集群。第一步选择k点作为初始值集群中心(意味着)(…),1 1 c c和终止条件。比所有数据点分配给他们最亲密的群集中心ci基于每个点之间的欧氏距离和每个集群中心,表示为:
图像(2)
我,k。现在,每个集群中心的意思是重新计算的平均集群的点:
图像(3)
重复(2)和(3),直到t集群中心的意思是不改变
该算法的主要优点是它的简单性和速度,允许它在大型数据集上运行。其缺点是,它与每次运行不产生同样的结果,因为结果取决于初始集群随机分配,因此代表了一个局部最小值。它最小化intra-cluster方差,但并不能保证结果的全球最小方差。另一个缺点是他们的表现可能会受到异常值的存在。每个集群的离散性使k - means分析和算法棘手。硬盘分区的最大缺点是这个概念,它包括一个数据点在一个分区或严格排除;没有其他机会的数据元素的多个分区在同一时间。然而,在自然集群总是如此,一些数据元素的部分属于一组和部分到一个或多个其他设置。为了克服这个限制,引入了模糊分区的概念,在下一节中讨论。

模糊c均值(FCM)聚类算法

模糊逻辑是模糊集的逻辑;一个模糊集,潜在的无限范围的真值1和0之间。在模糊逻辑命题一定程度的真理和加入模糊集可以完全包容,完全排斥,或某种程度上[18]。模糊集是不同于一组脆,它允许元素隶属程度。模糊集的核心是它的隶属函数。它是一个函数定义了集值的关系域及其隶属程度set.Fuzzy模糊c均值(FCM)聚类算法允许一块数据属于两个或两个以上的集群。对象是集群用k是集群的数量。缩写符号C = C₁,…, ck用于完成集群中心的集合。给定一组n个观察值inp-dimensional欧几里得空间,FCM聚类的目标是分区的nobservation k组(k < n),以减少within-cluster平方和(wcs)。FCM最小化目标函数(19、20)如下:
图像(4)
n是数据项的数量,k是集群的数量2 k < n, xj p-dimension j测量数据,;ij是xj的隶属程度在第i个集群中,猴是一个加权指数决定的程度的模糊性产生的集群,。是任何规范表达的相似性测量数据和中心。对于m = 2,这相当于正常化的会员线性和1。当m的值接近1,那么集群中心给出最接近点比其他人更多的重量和k - means算法类似。会员矩阵U = (ij)及其元素必须满足以下约束条件:
FCM算法的第一步是选择值k、m和终止条件。下一步选择k点作为集群中心的初始值(意味着)()。现在,通过最小化目标函数找到会员矩阵U(4)和获得解决方案
图像
现在发现集群中心的矢量C通过最小化(4)和获得的解决方案是:
图像
重复(5)和(6),直到满足终止条件拿数据中心集群的最大成员价值观和会员逐渐降低,当数据点远离集群中心。像k - means,该算法也最小化intra-cluster方差,但同样的问题作为k - means,最低是一个局部最小值,结果依赖于初始选择的集群中心。它具有更好的收敛性能与k - means算法。FCM需要存储U和所有ci和交替U和可信区间估计的原因计算和存储负担大型数据集[23]。

随机数据集的分类

第一分析上述partitional聚类算法的考虑[24]中给出的例子。四个正态分布随机数据集与中心(0.125,0.25),(0.625,0.25),(0.375,0.75)和(0.875,0.75),分别为每个生成200个样本。现在,上面的数据集混合在一起并生成完整的数据集xj = [XjYj]的800个样本图1所示。数据集xj是集群使用k - means和FCM聚类算法的假设四个集群中心。
图2图2 (a)和(b)显示了结果是获得使用k - means和FCM算法,分别。集群中心显示为,,*和O符号。FCM算法使用模糊参数m = 0.00001 = 2和终止标准。同时描述聚类算法应用了使用Matlab软件对随机数据和每个集群中心的位置。集群中心的最终位置为每个集群使用聚类算法表1所示。

分类单坦克区域

识别的区域应划分开环数据点根据离散事件。之前的识别区域,数据分类使用集群需要选择合适的方法对集群数据。partitional聚类算法都是应用于单坦克区域且在(9,25)和获得的结果进行了分析。单箱的原理图区域是图3所示。给定系统混合特征由于它涉及离散事件随着水箱内水位的改变它的高度超过0.3厘米。
质量平衡和这个法对单坦克非线性混合动力系统由(7)和(8):
图像
图像
,= 0.0154平方米的横截面是坦克和4 K = 2打败m2是插座孔的横截面,u是输入流量,g = 9.81米/ sec2引力常数和h是坦克的水平。给定的混合单坦克系统分为两个区域,因为坦克的截面变化时水平高于0.3。一组数据集xj = (hj uj-1)生成的1000个样本抽样时间1秒和通过使用一个随机输入uj值在0到0.001之间。添加了一个随机误差有界3% hj测量水平。模拟混合单坦克开环反应的输入和输出图4所示。FCM和k - means算法已经应用到数据集的xj假定系统有两个集群中心。集群中心显示为和O符号。模糊聚类算法使用模糊参数m = 0.00001 = 2和终止标准。kmeans算法已用于终止标准= 0.00001.Fig。5 (a)和图5 (b),显示了分区结果的k - means和FCM聚类算法使用混合单坦克系统的开环数据集。在表2中,分类结果为0.3 h, h > 0.3给定数据点的实际数量和数量的数据分区使用FCM和k - means算法。

结论

在本节中分析的k - means算法和FCM partitional进行基于以上两个例子。表1显示的平均估计误差定位集群中心使用k - means FCM是比较少。表2给出的信息分类和给定混合系统的误分类错误数据点的1型和2型区域。k - means聚类方法很容易实现。最大的缺点的k - means聚类的概念,它包括一个数据点在一个分区或严格排除;没有可能性的数据是在同一时间多个分区。然而,在自然集群总是如此,一些数据元素的部分属于一组和部分到一个或多个其他设置。FCM允许数据点超过一组的一部分使用成员函数。除了分配股票集群的数据点,绝对隶属度也可以表达隐约或数据点应该属于一个集群。与k - means相比很不敏感的聚类中心初始化,它不可能被困在一个不受欢迎的在实践中目标函数的局部最小值。 Given analysis useful forthe classification of open loop data for the NHDS, which is useful for identification and control of hybrid systems.

表乍一看

表的图标 表的图标
表1 表2

数据乍一看

图1 图2 图3 图4 图5
图1 图2 图3 图4 图5

引用

  1. a . van der Schaft h·舒马赫,介绍混合动力系统,斯普林格出版社,伦敦,2000年。

  2. V.S. Branicky S.K.M.博卡,”一个统一框架混合控制:模型和最优控制理论”,IEEE反式。自动控制,Vol.43, 461 - 474年,1998页。

  3. a . Bemporad M。控制系统集成逻辑莫拉里。”动力学和约束”,自动化,35卷,第427 - 407页,1999年。

  4. m . Hirata y .桥本,野口勇,足立,“机械系统的混合建模方法。机电一体化”,20卷,页59 - 66年,2010年。

  5. g . Ferrari-Trecate m . Muselli d . Liberati m·莫拉里“集群分段仿射系统的识别”技术,自动化,39卷,第217 - 205页,2003年

  6. A . Bemporad A . Garulli s Paoletti,维奇诺,“bounded-error分段仿射系统识别方法”,IEEE自动控制,50卷,第1580 - 1567页,2005年。

  7. h .中田宏Takaba K, T。片”,确定分段仿射系统基于统计聚类技术”,自动化,41卷,第913 - 905页,2005年。

  8. 戈拉米,m . Tabatabaei-Pour m . k . Salahshoor h . r .瓶“递归确定分段仿射混合动力系统”,IEEE 9日国际会议进行控制,自动化、机器人和愿景,1 - 6,2006页。

  9. 卷Gegundes j . Aroba J.M.布拉沃,“分段仿射系统的识别通过模糊聚类和竞争学习“,英格。应用。人工易达利。,Vol. 21, pp. 1321-1329, 2008.

  10. s . Ghosh s马卡-“一个基于模糊聚类技术的分段仿射近似一类非线性系统”,Commun非线性科学模拟,15卷,第2244 - 2235页,2010年。

  11. A.K. Jain, M.N. Murty P.J.弗林,“数据聚类:审查”,ACM第一版。调查,31卷,第323 - 264页,1999年。

  12. 许r和d·温斯迟,”IEEE反式聚类算法”的调查。神经网络,16卷(3),645 - 678年,2005页。

  13. Berkhin,“聚类的数据挖掘技术的调查”,技术报告,获得软件,CA, 2002。

  14. 硕士伊斯梅尔S.Z.斯莱姆,“k - means算法类型:广义收敛定理和局部最优的特性”,IEEE反式。模式肛门。马赫。Inteli》第六卷,第87 - 81页,1984年。

  15. t . Kanungo d·m·山:美国内塔尼亚胡,c, d . Piatko r·西尔弗曼和a . y .吴“高效的k - means聚类算法:分析及实现”,IEEE反式。模式分析与机器智能,24(7)卷,第892 - 881页,2000年

  16. g . Patane和m . Russo“全自动集群系统”,IEEE反式。神经网络,13(6)卷,页。1285 - 1298年,2002年。

  17. m·c·苏和c·h·周”,修改版本的k - means算法与基于clustersymmetry距离”,IEEE反式。模式分析与机器智能,23(6)卷,第680 - 674页,2001年

  18. j·s·r·张成泽C.-T。太阳,e .弘水谷”去噪和软计算:计算方法学习和机器智能”,普伦蒂斯霍尔出版社,1996。

  19. j . c . Bezdek“集群与模糊集有效性”,cybernetis学报,3卷(3),58 - 73、1973页。

  20. j·c·邓恩,“最近的一些invesingations新的模糊分区算法及其应用模式分级问题”,《控制论,卷4(2),页1 - 15,1974。

  21. n . r . j . c . Bezdek Pal,“一些新的集群indessess有效性,IEEE事务处理系统上男人和控制论”,28卷(3),301 - 315年,1998页。

  22. 迦特,他Geva”,无人监督的最优模糊聚类”,IEEE反式。型。肛交。马赫。Int, 2卷,第781 - 773页,1989年。

  23. K.-L。杜,集群:神经网络方法,神经网络,23卷,第107 - 89页,2010年。

  24. 熊,kc,“Towards an unsupervised optimal fuzzy clustering algorithm for image database organization”, IEEE Comput. Society, Vol. 3, pp. 3909-3912, 2000.

  25. a . k .沙·d·m·Adhyaru基于“模糊选择PWARX模型非线性混合动力系统”,IEEE第三NUiCONE国际会议上进行,1 - 6,2013页。
全球技术峰会