所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

一个数据挖掘模型来阅读和分类你的员工的态度

J John Victor Antony, G M Nasira
  1. 高级段工程师,印度铁路,特里希,印度
  2. 助理教授,奇克卡纳政府艺术学院,蒂鲁普尔,印度
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际计算机与通信工程创新研究杂志

摘要

我们已经吸取了许多教训,强调这样一个事实,即拥有积极心态的员工的影响肯定可以让一个组织走上成功的轨道,而拥有消极态度的员工的存在不仅会扩散已经存在的积极空气,而且会完全停止增长引擎,将组织推入灾难性的无法恢复的状态。因此,了解员工的想法对于采取积极的措施来保持增长势头至关重要。作者已经发展了一个模型,以循序渐进的教程方式解释,来阅读和分类员工的态度。该模型采用K均值聚类方法构建姿态阅读器,采用旋转森林方法构建姿态分类器。最终,该模型已经在涉及列车运营的员工的典型数据集上进行了测试。

关键字

聚类,分类,态度分类器,态度阅读器,铁路

介绍

许多组织灾难是由人造成的,而不是机器造成的,机器通常不会出现故障,因为它们有经过验证的防故障技术。大企业的高管们经常承认,一个公司的成败在很大程度上取决于人们的态度,而人们的价值甚至超过在机器和材料上的最大投资。这是非常清楚的;当我们看到一些新颖的以员工为中心的措施时,比如弹性工作时间、在家工作、赞助聚会、家庭旅行,这些都是世界各地的顶级公司采用的。这些措施都是为了让员工觉得公司是一个工作的好地方。尽管事实是,许多创新的头脑一起工作,制定战略,以确保员工的忠诚度,建立积极的工作氛围,研究和管理的人的动态在一个组织逃避所有的方法,继续成为一个强大的分支研究永远,即使有很多分析方法的可用性。在技术应用方面,我们遇到了人工智能(AI)和数据挖掘(DM)技术通过各种传感器输出、故障预测、解决方案建议等用于故障模式分析的无数情况。深入研究患者的医疗参数、生存预测和治疗建议并不罕见。在市场分析、客户购买行为、银行贷款清算等方面的应用以及图像处理是研究人员经常涉及的一系列领域。所有这些领域都被计算机科学的学者们反复访问,每次都试图在算法、方法论和分析方面增加价值。 This apart, dealing with human resources in an organization which is a herculean task has, so far been the subject matter of social scientists and human resource managers. They resort to various analysis techniques, mostly qualitative in nature, the efficacy of which is an ongoing debate. The supremacy of qualitative versus quantitative methods and vice versa is also being continuously disputed, although the quantitative measurement of any parameter brings out an objective perspective, much to the convictions of many. Not inclined to get entangled in to the debate, the authors earnestly wish to present a DM model and say that the analysis of human dynamics can be strengthened and validated by adopting the rich techniques available in data mining analytics. An in depth literature survey highlights the fact that DM techniques can make greater inroads, filling many gaps, especially in analysis and thereby mutually reinforcing the interdisciplinary element between computer and social sciences. Through this research work, the authors specifically tend to evolve a model for study and analysis of human attitudes. The model, in its first stage, measures the parameters quantitatively using a well designed questionnaire, transforms the model suitably to qualitative one but carefully using numeric indices / labels with an aim of harnessing the power of DM algorithms, and progresses to analysis stage using clustering based attitude reader (AR) and finally ends up with the construction of an attitude classifier (AC).

背景

A.态度:增长动力:
事实证明,每个成功的组织都有效地投资于最有价值的资产——人。它们是不可缺少的珍贵资产,其价值超过资本或设备。这样的组织的领导者成功地创造了一种组织文化,在其整个层次上促进积极的态度。在一个组织中,积极的态度能促进发展
团队合作
减少废物
提高生产力
•确保员工的忠诚度
事实上,今天最大的问题是人的问题。如果培养得当,人才是宝贵的资产,否则就会成为难以承受的负债。哈沃德大学的一项调查表明,80%的情况下,组织根据人们的态度来招聘。如果这是对态度的重视,组织需要在有时限的方式上阅读或评估员工的态度,以确保态度水平保持在最佳状态,甚至在潜在问题出现之前发现它们。影响员工态度的因素有很多。以下因素大致决定了组织结构中的态度水平。
员工参与决策过程
•所担任的职位或名称(工作性质)
组织内部的互动
政策
技术
•指令流程
工作环境
员工福利
·申诉机制
B.问题陈述:
考虑到态度及其对生产力的潜力的重要性,每个组织都倾向于在人力资源经理和/或社会科学家的帮助下进行相同的测量,这些人在大多数情况下诉诸于定性评估,这是基本事实的相对指标,也使研究的结果不太适合进行模式分析。如果以数量数字和新出现的模式提供产出,最高管理层会感到受到指导和加强。在DM算法的帮助下,以定量分布和模式的形式呈现的基本真相将使最高管理层对所研究的问题有基于证据的见解和更客观的观点。作者的主要动机是发展一个更定量和更适合DM算法的通用模型,用于模式生成和所研究因素的分类。作者的第二个动机是将研究的参数具体限制到涉及列车运营的组织。在目前的情况下,该组织是最大的雇主,拥有120万名员工,负责该国的火车运营。这项工作需要高度的协调、计划和执行,并有许多紧迫的限制。作者选择了一些处理敏感操作的工作类别,并尝试使用所提出的模型调查他们的态度水平。工作的性质,关于选择的员工类别的研究广泛涉及
运行的火车。
·车辆和货车的检验/认证。
考虑到艰苦的性质,这就需要
在业余时间工作
呆在车站
持续的精神集中
身体素质
检查孤立的长而崎岖的路段、坑线等。
这些员工被称为组织的安全类别。尽管通过学科进修培训、瑜伽、压力管理、各种福利和津贴等一系列措施,旨在提高他们的工作准备和满意度,但他们的态度似乎很低,需要适当的干预。一个被广泛接受的事实是,管理开火车的员工比其他员工更难,有关这些员工的问题在每个管理层和决策过程中都得到了广泛的关注和讨论。此外,这些员工的数量构成了组织的整个劳动力的相当大的一块。虽然管理层以快速解决方案解决日常问题,但现在需要的是系统地研究他们的态度和分析其模式,以便长期解决他们的问题。
我们能客观地衡量/解读他们的态度吗?
我们能找出某种态度模式吗?
我们能否对他们的态度进行分类,以便采取积极的措施?
我们能有一个更适合这种应用的基于数据挖掘的模型吗?
这些是作者在本文中讨论的相关问题。在这项努力中,他们试图推导出一个模型来阅读和分类员工的态度。

相关工作

虽然有许多研究工作旨在研究和改善机器的性能,但寻找有关人力资源的相关文献,即使是现在,对社会科学家来说,理解人力资源也一直是一项艰巨而具有挑战性的任务,即使有大量的分析工具,结果也微乎其微。更重要的是,大多数研究总是倾向于使用方差、相关和回归等方法进行分析。利用DM算法进行研究似乎是不存在的。下面简要介绍了研究人员的相关工作,为这一说法提供了证据。
[2]使用交叉滞后回归分析,探讨了积极的员工态度和行为是否会影响业务结果,反之亦然。[3]的研究表明,对薪酬的态度对于吸引员工很重要,而福利对于留住员工很重要。该研究使用了四年的数据,并每年进行评估,以研究这种关系随时间的变化。[4]使用机器学习技术和基于字典的方法来检测用户表达负面态度的评论。所使用的数据是用户在You Tube上生成的在线评论。[5]试图回答关于工作满意度和组织承诺的问题,通过对用户问卷的回答进行定量分析,使用模糊集向量的硬c均值算法。[6]使用滞后分析方法分析了35家公司8年来的员工态度数据,并建立了工作满意度与组织财务和市场绩效(资产回报率/每股收益)之间的关系。[7]使用相关和回归技术研究了人格特征及其对工作态度的影响之间的关系。[8]运用社会科学理论之一的理性行为理论(Theory of Reasoned Action, TRA)来理解知识共享行为以及外部奖励对知识共享态度的影响。[9]通过SPSS软件对调查结果进行相关分析和多元逐步回归分析,探索组织承诺、员工满意度和工作绩效三个因素之间的相互关系,并向管理层提出建议,从而建立更好的组织氛围,改善员工的工作态度,提高员工的工作绩效。[10]利用组织政治感知量表、工作满意度调查表和组织承诺量表等三种常用工具,试图找出组织政治、工作满意度和组织承诺之间的关系。 [11] recorded significant attitude changes by subjecting the participants to a class room simulation exercise that included answering a well constructed questionnaire. [12] in their study, used a path model to analyze the so called three dimensions namely person to policy fit, person to supervisor fit and person to coworker fit, and showed that overall person to organization fit was positively correlated to job satisfaction, and person to supervisor fit had a direct effect on turnover attitude. [13] has taken workforce diversity in an organization as a major objective and estimated employee attitudes toward diversity and compared the same with other organizations by using survey method and statistical analysis. [14] analyzed the relationship among some basic demographic characteristics of the employees such as their age, gender, level of education, work experience, EI levels, and their work attitudes using questionnaire survey data from eight different enterprises and statistical analysis. [15] worked on predictor variables of college students' attitudes toward seeking professional psychological help, using regression and variance analysis. [16] presented a simulation model, built on system dynamics methodology which is a mathematical modeling technique to understand the behaviour of complex systems over time. They focused on enabling disabled people to move from welfare to work by incorporating attitudes of disabled people and employers and bringing out key factors that enable and encourage disabled people to take up jobs.

提出的模型

下面是所提议的模型的一种不言自明的图示。它展示了问卷设计、数据集、AR和AC构建的顺序,以及组织为改善组织成长可以采取的主动步骤。
问卷调查:
编制了一份包含25个问题的调查问卷。本质上客观的问题旨在衡量以下属性。
组织承诺
•工作满意度
•对薪酬的满意度
•对促销活动的满意度
•对主管的满意度
对工作的总体满意度
•辞职的意图
每个问题都是基于2点的直接“是”或“否”的回答量表。回答“是”将得到+ 4分,而回答“否”将得到- 4分。总分为+ 100分或- 100分,称为态度分数。因此,分数保持数值性质,目的是使响应分数易于分析。
b .数据集:
表1列出了所考虑的领域。字段进行了转换,以便DM工具可以应用。转换后的字段如表2所示。可以注意到,表中“态度”字段的域有四个范围,分别表示态度水平的强度。这四个范围是通过使用免费的数据预处理工具data prepareator (DP)设置切点来创建的。

模型实现与讨论

A.实验工具:
考虑使用开源数据挖掘工具Weka 3.6.7。它是用Java编写的,由新西兰怀卡托大学开发,在GNU通用公共许可证下免费提供。Weka代表怀卡托知识分析环境。Weka 3.6.7是一个用于数据挖掘任务[17]的机器学习算法的集合。它包含了数据预处理、分类、回归、聚类、关联规则挖掘、特征选择和数据可视化的工具。[18]给出了Weka接口的帐户。
B.态度
采用刚性聚类算法K-means算法实现增强现实。刚性聚类是指采用排他聚类分离方案,即每个数据点精确且只属于一个分区的划分方法。K均值算法采用了这样的划分方案。它使用默认的欧几里得距离或曼哈顿距离测量。如果使用曼哈顿距离,则中心点计算为分量的中位数,而不是平均值。当定义了一组对象的均值时,K-means算法是适用的,但不可能定义名义变量的均值,因为我们已经将数据字段转换为范围。在这种场景中,它为每个集群输出每个标称属性值的频率计数。此特性可用于分析标称数据,方法是将其视为具有k个不同值或状态的k种分类变量,并通过使用所有标称属性的编码方案或[19]来创建数据摘要。为了从频率计数的角度了解数据集中可用的ground truth,因此选择并配置了K-means算法。参数配置是对数据挖掘软件在实验运行过程中的重要参数进行设置。 The key parameter values are set as below.
—displayStdDevs = True。此设置将标称变量的频率计数发送到当前上下文所需的特性的输出,否则将输出数值属性的标准偏差
distanceFunction =欧氏距离或曼哈顿距离
—集群数= 1。这是有意设置的,因为我们感兴趣的是将整个数据集的输出生成为一个实体(集群)。
其他值可以保持默认设置。得到的输出如表3所示。图2、3、4提供的频率分布是不言自明的,以便用户更好地理解。当以所选变量的频率计数形式呈现时,数据集的基本真相可以更好地为用户可视化和理解。通过迭代,发现Weka中可用的K-means算法在生成频率计数方面的输出方面是有效的。
图2给出了数据集中可用职位名称的频率分布。这项研究考虑了六种工作头衔。
图3给出了员工被测态度的频率分布。“态度”被整合为<- 100_50)、<-50_0)、<0_50)和<50_100>四个范围。
图4给出了态度在<-50_0)范围内的员工的频率分布。其他姿态范围也可以生成类似的分布。
C.态度分类器:
AC是通过分类算法(Classification algorithm)来实现的,分类算法依赖于归纳学习[20],其中模型是利用数据元组中足够数量的已知示例来开发的,通常是利用专家的知识。当元组的类标签已知时,称为监督学习。已知类标签的元组集合用于训练学习函数。在这个训练集上训练的模型能够使用之前的知识预测未来未见的情况。这里的目的是为以前未见过和未标记的标称数据对象分配正确的类。原始数据集作为分类器算法“旋转森林”的输入。字段“attitude”被设置为类变量。结果表明,该方法的分类准确率为86%。为了提高分类精度,复制了数据集,以便有足够的元组用于训练分类器模型。利用DP进行数据复制后,准确率可达99%。 The experiments were repeated using the other classifier algorithms. The results were found satisfactory. Rotation Forest algorithm with its proven efficiency and accuracy [21] was used to classifying the employees’ attitudes. The algorithm’s out put summary is provided below in Fig 5 and Fig 6.

结论

本文的主要目的是展示DM方法在处理人力资源相关问题方面的应用适用性。提出了一个使用数据挖掘的通用模型,并使用适当的数据集和算法验证了其可行性。模型的一部分展示了如何利用聚类概念以频率计数的形式读取属性值,从而构建了基于K均值算法的Attitude Reader。态度分类器是基于旋转森林(一种分类算法)构建的模型的另一部分,演示了如何使用它对人类态度进行分类,以便在组织范围内规划主动步骤。作者强烈认为,数据挖掘方法可以超越机器和传感器输出,并在组织设置中找到适合处理人类动态的DM。通过他们的模型,他们相信,除了方差、相关和回归等传统的统计技术外,社会科学家还可以通过使用数据挖掘进行分析和模式生成来获得收益。最后,所提出的模型也易于普通用户实现。

表格一览

表的图标 表的图标 表的图标
表1 表2 表3

数字一览



图1 图2 图3
图1 图2 图3
图4 图5 图6
图4 图5 图6

参考文献

  1. 卡拉,S.,《你能赢》,麦克米伦出版,2000年。

  2. 陈志明,“员工满意度、组织公民行为、员工离职对组织效能的影响:单位层面的纵向研究”,《人力资源管理研究》,第1卷,第101-114页,2001。

  3. Carraher, s.m,“在爱沙尼亚、拉脱维亚和立陶宛的员工和企业家中,使用对福利、薪酬和薪酬满意度的态度进行离职预测”。管理学报,Vol. 6(1), pp.25-52, 2011。

  4. Kandias, M., Stavrou, V., Bozovic, N., Mitrou, L.,和Gritzalis, D.,“我们能信任这个用户吗?通过YouTube使用情况分析预测内部人士的态度。第10届IEEE自主和可信计算国际会议(UIC/ATC),第347-354页,2013。

  5. Auephanwiriyakul, S., Keller, J. M.和Adrian, A.,“通过语言硬c手段进行管理问卷分析”。第19届北美国际会议第402-406页,2000。

  6. 施耐德,B.,汉格斯,P. J.,史密斯,D. B.,和萨尔瓦乔,A. N.,“员工态度和组织的财务和市场表现,哪一个更重要?”,《心理学报》,2003年第5期,第836页。

  7. 陈志明,“人格满意度与工作满意度的关系研究”,《心理学报》,2002年第3期,第53页。

  8. 阿明,哈桑,M. F.,阿里芬,M. B.,和拉赫曼,M.,“外部奖励对个人知识共享态度影响的理论框架和内在属性的作用”,计算机技术与发展国际会议,第2卷,pp. 140 -243, 2009。

  9. 金春华,“组织承诺、员工满意度与工作绩效的关系研究”,管理科学与工程,2009年第4期。

  10. “组织政治、工作满意度与组织承诺的关系研究”,《管理科学与工程》,2012年,页377-382,2012。

  11. 舒马赫,t.r.,“模拟与态度改变:演化研究模式”,第30届夏威夷系统科学国际会议论文集,第2卷,第648-654页,1997。

  12. 杨春江、杨红兰、叶良,“人-组织契合度对员工离职满意度的影响——以服务业为例”,《管理科学》,第2卷,页320-323,2011

  13. 皮尔斯,A.,古德温,S.和贝克,A.,“劳动力多样性:技术管理创新中的员工态度和看法——全球领导力的关键”,PICMET'97:波特兰国际IEEE管理与技术会议,312页,1997。

  14. 关欣,吴玮,胡玮,“人口统计学特征、情商水平与员工工作绩效的关系研究”,第二届人工智能管理科学与电子商务国际学术会议(AIMSEC), pp. 6416-6419, 2011。

  15. 张志宏,“大学生心理专业求助态度的影响因素”,第四届国际学术会议,第1-4页,2010。

  16. Abdelgawad, A. A., Snaprud, M. H., Krogstie, J.和Brynn, R.,“残疾人从福利到工作:决策支持工具”,第六届IEEE亚洲建模研讨会(AMS),第132-137页,2012。

  17. Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P.和Witten, i.h .,“WEKA数据挖掘软件:更新”,ACM SIGKDD探索通讯,第11卷(1),第10-18页,2009。

  18. Witten, i.h.和Frank, E.,“数据挖掘:实用的机器学习工具和技术”,Morgan Kaufmann, 2005。

  19. pepedhazur, E. J.和Schmelkin, L. P.,“测量、设计和分析:综合方法”,心理学出版社,2013年。

  20. 普尔,D. L.和马克沃思,A. K.,“人工智能:计算代理的基础”,剑桥大学出版社,2010年。

  21. 孔彻瓦(音译),Rodríguez, J. J.,“多分类器系统中轮作森林集成的实验研究”,北京大学学报(自然科学版),页459-468,2007。

全球科技峰会