石头:2229 - 371 x
钱德拉塞卡班达*Phani Kumar年代
部门计算机科学工程建邦者GITAM大学纳,印度
收到:2021年- 12月31日,手稿。集选区- 22 - 50690;编辑分配:03 - 1月- 20212 QC前没有。集选区- 22 - 50960 (PQ);综述:05 - 1月- 2022,质量控制。集选区- 22 - 50960;接受:10 - 1月- 2022年手稿。集选区- 22 - 50960 (A);发表:17 - 1月- 2022,2229 - 371 DOI: 10.4172 / - x.13.1.001
访问更多的相关文章全球研究计算机科学杂志》上
人民的不断变化的需求正在由技术进步的变化。改变技术一直是软件行业的黄金鸭。大数据所有的投资者不得不改变他们的心态和关注项目从不同的领域如金融、健康,更多的基于大数据分析项目。尽管有各种各样的策略被大多数软件公司,采用这些策略已经失败在大数据项目的成功交付。因此,在本文中,我们提出了一个全面的营利性的框架来实现大数据和分析项目。该模型都有利的方面在进度和交付项目成功分百分比最高客户满意度和预测精度。
预测;大数据分析;聪明的;项目管理
大数据这个词有了突出的位置在当前技术时代。世界是担心大数据管理(即存储),但即使是处理如此巨大的数据变得复杂。的软件行业已经开始开发各种工具持有大数据的能力。大数据出现的地方是卫生保健、金融营销、软件市场和教育等。在这些领域有巨大的潜力开发项目(1]。
然而,主要的挑战是与大数据相关的开发项目。在这个领域的研究工作很少。根据Gartner的调查,发现约80%的大数据项目失败了。失败的原因进行了分析,不同的研究人员。然而,失败的原因调查他们远远不足以减少失败率(2]。
软件行业通常遵循传统的流程模型即,瀑布模型采用了从其他行业如建筑或工程行业。所有的传统流程模型观察成功客户需求是预定义的,静态的,和已知的先验的。需求不断变化的需求,活力,对终端用户的需求,缺乏清晰等,软件行业不得不采用一种不同的方法敏捷模型,客户也都是作为项目的一部分开发和产品迭代开发。
主要的焦点是传统模型在多大程度上适合基于大数据的当前的热门项目。根据Gartner公司2018年的报告,发现约60%的大数据项目失败只在初始级别(3]。2018年尽管Gartner的报告似乎是太顺从,说60%的项目失败,事实上,这是观察到的失败率约为80%(2019年一步法)。项目的失败可能发生由于种种原因,如:
1。缺乏正确的客户需求。
2。维护客户的未来需求。
3所示。软件成本估算是不当。
4所示。缺乏相关领域的专家。
5。数据
根据可用的文学(图1许多调查),各个机构进行;应该有一个更加复杂的、可行的和健壮的模型,该模型有助于软件行业处理大数据项目成功交付产品与产品和客户的最大信心(4]。
在本文中,我们试图调和的方面关注软件行业在接受项目和预测软件项目成本估算和失败在成本估算,以及各种其他因素影响大数据项目的失败。
其余部分组织如下:第二节阐述了可用的工作至今,以及失败的原因,和论文的第三节突出了什么其他的因素要考虑大数据项目成功(5]。论文的第四部分明确强调数据和数据管理的重要性在软件行业,以减少大数据项目失败。最后,第五部分总结了纸。
相关的工作
这个词大约二十年前的大创造,获得最高的重要性在当前技术时代。在成功地实现大数据项目,这是初步的,大多数公司更关注这些大数据项目。软件公司已经开始逐步采用大数据分析(6]。
一些项目使用失败由于预测成本估算过程研究的预测软件成本估算。早些时候,在70年代,软件成本估算是纯粹基于可测量的参数,如代码行(LOC)和其他直接的措施2]。然而,软件的成本估算是充分的LOC (7]。然而,这取决于其他各种间接措施派生于1970年代中期使用数学技巧。他已经使用了一些图论概念称为圈复杂度指标,另一个基于大小的度量还开发指标努力估计基于统计技术。沈,et al . 1984年提出某些指标被认为是虫子的数量密度。可以看出,如果缺陷的密度增加,有一个高概率产品失败。
Chidamber, et al . 1994年评估面向对象度量称为CK指标。这些CK指标加权方法每个类(WMC),继承深度(说)的儿童数量(NOC),和对象类(CBC)之间的耦合,为一个类(RFC)反应,缺乏凝聚力的方法(LCOM)。
范et al . 2004年注册几个改进霍氏的复杂性度量通过增加重量。作者建议不同的权重为操作数和操作符。
成本估算模型分为两大类基于的方法/程序,算法和Non-Algorithmic等。然而,所有这些模型只适合对传统开发方法(8]。
迈克尔•布洛赫et al . 2012调查,以及牛津大学,发现约45%的项目超出预算7%,随着时间的推移,导致成本和进度超支的风险最高。
它高管识别四类影响大多数的项目失败的问题。
•失踪的焦点
•内容问题
•技能问题
•执行问题
评估上述四个问题称为是一个“价值保证”表明项目的幸福。这种方法有一个坚实的记录。图2下面显示了每个类别的成功因素的“价值保证”中,有5个因素被认为是价值的保证。
加布里埃尔Kabanda 2019年,在他的研究结果指出,高度大数据项目的关键方面是找到合适的人对项目的成功和客户满意度和项目工作团队的任务。他预期,AI和ML的使用在项目作业将援助项目的成功(图2)。
第三大数据项目的主要方面是数据本身。主要的问题是,“数据足够吗?数据完美/可以使用吗?的字段在数据充分分析所需的方面呢?“回答这些问题应当减少失败的风险的程度50%已经在下一节中讨论。
提出了框架
虽然已经没有多少在这一领域的研究,研究人员从不同角度,说明行业大数据项目失败的原因(9]。这个问题抛出一个巨大的挑战对软件产业和AI-ML-based初创企业成功交付项目。这些大数据分析项目的主要方面是获得一定程度的信心。行业的可信度在于精度获得在特定项目的预测分析10]。因此,在本文中,我们提出了一种新的混合框架的框架大数据分析项目成功交付。虽然不同的研究人员表示,项目的失败提交一个或两个,统计数据仍然是惊人的。
等框架有四大类:
我预测成本估算指标,
二世。人力资源、
三世。数据管理和
四、项目管理。
上述四个类别的详细实现各个方面为汇业银行项目(检查在我们的位置图3)。
成本估算指标的预测
成本估算也称为“努力估计,”(图4)起着至关重要的作用,使企业获得利润(11- - - - - -14]。根据这项研究,发现约45%的项目失败了,由于成本超支或由于超出预算15]。一般来说,有两种模型,即算法和Non-Algorithmic模型,估算软件成本。有明确的成本估算工具,可以预测的成本一般项目。也有许多公司开发的项目,已经有一个模板成本估算(16,17]。所以,团队可以估计成本容易如果类似的项目已经开发了。也有可能,成本估算也可以通过使用专家判断(nonalgorithmic)早些时候类似的项目并不发达,和模板是不可用的,考虑到条件,团队的成员过去经验在发展中类似的项目提出了一种混合方法,面向对象度量和传统指标(18]。当前汇业银行的大多数项目是使用面向对象的开发方法,该模型适合,收益率约95%的准确率。
项目最初分类基于它们所属的域,每个域是与一定的参数估计,许多方法在课堂上,继承深度耦合,大量儿童类、复杂性、平均圈复杂度,等,和额定高、中、低和一定的权重。这将简化项目的成本估算和高度准确。的表1下面的插图显示的一个例子3不同的领域和传统和面向对象度量分析。
类别 | 稳定 | 路径 | 圈复杂度 | 嵌套 | 行数学 | MCDC | 复杂性 | 疯狂的 | 时间 |
---|---|---|---|---|---|---|---|---|---|
金融 | H | l | 米 | H | 米 | 米 | l | H | H |
游戏 | l | H | H | 米 | H | H | H | 米 | 米 |
沟通 | 米 | 米 | l | l | l | l | 米 | l | l |
表1。传统指标分析。
除了表2,有必要理解也要分析的数据的大小。方面的数据大小后的小节中讨论。
类别 | #类中的方法 | 继承深度 | 耦合# | 儿童类# | 复杂性 | Avg CC。 |
---|---|---|---|---|---|---|
金融 | l | 米 | 米 | l | l | 米 |
游戏 | H | H | H | H | H | H |
沟通 | 米 | l | l | 米 | 米 | l |
表2。面向对象度量分析。
人力资源:在传统的项目,执行人力资源评估基于# LOC, #天交付,等等,然后用于部署此类项目的员工。团队领导或项目经理用来评估时间和数量的工作要做,在艰难的情况下,额外的人用于部署到团队避免进度超出[19]。可怜的估计所需的工作产品和劳动力导致进度超出。然而,这种情况下上市太少。意想不到的方面有关员工要么是人们戒烟的项目由于别处有更好的机会。然而,汇业银行项目也有很多这类问题等提高技能的员工,技术适应、团队建设、管理员工的角度而言,交付周期(长或短),和管理实践,大多数员工的公司BDA不够熟练处理项目。必须提供他们所需的技术培训20.]。高效和有经验的专家将帮助理解技术和业务问题,汇业银行项目非常重要。团队成员的专业知识应增加100%的性能与他们的判断能力来解释数据及其模式。有多种技术可以解决汇业银行项目从不同的领域,有必要在技术和专业领域来确定最好的技术和可行的方法来解决问题和理解项目的见解,这有助于识别差距,同时收集业务需求。
在表3软件项目进度有一个严重的问题,和非软件项目的差额最高平均收益。成本超支影响因素是频繁的改变或模棱两可的需求导致成本超支,可怜的支出项目,估计等福利的不足是由于缺乏技术良好的人,缺乏沟通,在需求模棱两可,等。大部分的大数据项目失败由于缺乏清晰的需求导致短缺的好处。因此,它是至关重要的在大数据项目授权给技术人员。
项目类型 | 平均成本超支 | 平均进度超出 | 平均收益差额 |
---|---|---|---|
软件 | 66年 | 33 | 17 |
非软件 | 43 | 3.6 | 133年 |
总 | 45 | 7 | 56 |
表3。不同类型的IT项目明显不同的性能。
以下是最重要的因素是影响大数据项目的失败。
技能:技能是一个重要方面,任何人士成功完成给定的任务规定的时间内。数据科学家们在任何情况下不同于其他专业。随着大数据的数据规模巨大,传统数据管理的技能导致许多失败的原因,传统数据组织良好,而大数据是结构化和非结构化。所以,这画洞察数据至关重要。提取相关信息的能力的极大的被处理的数据量是每一分钟。因此,所需的最重要的技能是任何大的数据分析师分析思维,逻辑思维、技术专长、沟通技能、领域知识、业务技能,最重要的是,量化能力和统计。
技术应用:在软件行业中,特别是大数据分析等项目,可以使用的技术是经常变化的,他们从团队成员需要立即处理。团队成员应该适应新技术最早。同时,企业需要为员工提供所需的培训和培训成本也要考虑预测软件成本估算(21]。很少有公司部署独立的翅膀在公司培训员工培训。公司应该支持员工通过提供足够的培训先进技术来提高他们的技能,应对需求,提供必要的工具,并鼓励员工根据他们的表现。在今天的网络时代,人们习惯于在家更新他们的技能的最先进的技术。有巨大的平台,提供在线培训即,复数,edureka udemy,等等,在某些先进技术提供给员工。
团队建设
团队建设是最关键的,项目实施过程的关键阶段。团队应该是一个混合的所有成员拥有不同的技能,拥有不同经验水平(22]。然而,许多调查得出结论,存在某些约束形成团队,如所示图5。的团队建设有许多因素考虑。文学的各种模型采用在团队建设的过程中。需要考虑的约束动力学、选择标准被采纳。
利益相关者:利益相关者敲定需求中发挥关键作用,评估项目的性能和可用性。项目开发的输入必须从各种来源收集如最终用户、客户、和各种商业组织与类似的项目合作。这个过程应当帮助增强项目的性能,并提供范围提供附加功能的项目应当反过来,有助于提高客户的满意度(图5)。
在今天的分析,数据处理是一个重要的组件的分析为基础的公司。所以,大多数的企业都是数据驱动的。让来自不同数据源的数据也是具有挑战性的任务。
特别是,确定合适的人收集的数据是最具挑战性的问题。
“客户的声音引导世界级领导人的每一个行动和决定”
余常唱、乔治·拉博和维克多Rosansky。
的图6上面给出了一个收集来自各种数据源的数据,客户的声音是第一个最重要的方面,然后收集信息从业务涉及最重要的组织和目标群体。,最终用户谁是最终的受益者。识别和选择一个适当的数据收集方法(即采访、调查、焦点小组、观察)有助于提高项目交付更有效和成功。
数据管理
专业人员:软件项目的成功交付高度依赖于员工的专业知识和技能。某些项目需要部署高效和专业人员。同样,大数据分析相关的项目还需要部署专业人员如首席数据官分析官。按照我们建议的模型中,团队应该由一个合适的人的完美平衡。可以看出除了熟练的人,大数据项目很容易接收大量的数据在一个更高的利率品种的信息,等。利用接收到的数据不得为大数据项目的目的和可能导致错误的预测可能有很多缺失的值或其他在下一小节中讨论的问题。因此,有关数据处理所有这些问题,有必要部署数据管理方面的专家。每一步进行的一项调查显示,2017年,它是观察到这些公司雇佣首席数据官(CDO),分析总监(曹)首席信息官(CIF),和大数据(HBD)应当减少不当的风险数据导致错误。部署专家到项目应当加快项目完成,也会增加预测的准确性(23]。债务抵押债券的招聘自2012年以来已大幅增加。表4清楚地表明,专业人的部署将增加项目的概率成功交付。的图图7所代表的增加公司的专业人员为大数据分析的人。
任命一位专家 | 首席数据官 |
---|---|
2012年 | 12 |
2017年 | 55.9 |
2018年 | 62.5 |
2019年 | 67.9 |
表4。公司任命统计专业的人。
数据处理:这个术语最初使用大数据对1990年代和2012年以来受到广泛重视从tb字节转换重数据。现在,数据大幅增加更高的速度和准确性有各种品种的数据(24]。数据必须来自各种来源,如来自焦点小组访谈,观察在域从领域专家等,如图所示图8。至关重要的是确定正确的利益相关者获得数据。
后获得的数据,它也必须检查数据的可靠性。从/问卷调查获得的数据,有机会遇到可靠性问题中所示图9。可靠性问题发现由于诸如一些问题可能是无关紧要的或模棱两可的和一些问题可能不理解的应答器。一些问题可能复合。同时,是非常重要的分析答案/反应调查形成的原因,答案可能是偏见或曲解。因此,必须进行数据处理,以避免错误。
必需的参数:预测是定义声明由有人认为应当发生在未来基于某些假设或统计或特定的模式。但是,它是至关重要的评估参数,影响预测的必要性分析。预测精度是完全依赖于所使用的参数和模式识别。任何分析项目的可靠性在于预测的准确性。精度越高,将越高的顾客满意度循序帮助扩大业务。保留或承受客户的信心是最艰巨的任务,因此在本文中,我们建议识别参数的最佳方式。
在我们的模型中,参数可分为3个层次,如直接相关的参数,间接参数和隐藏的参数有关。的细节参数分类下一节讨论(25- - - - - -28]。
项目管理:项目管理是最重要的方面在处理大数据和分析项目。任何公司应当有一个评估模型结构(项目管理值)的测量项目管理的性能。较强的项目管理、项目的成本效益越高。项目管理的有效性取决于各方面可分为:
。金融方面:金融方面的措施显示,投资回报(ROI)的变化,生产力,节约成本,每股盈利和现金流,经济价值,销售增长方面增加的产品和收入流入。
b。客户方面:客户是治疗高度优先的人在整个项目开发过程。他收益至关重要在所有参与项目的人。客户满意,他的盈利能力,客户保留,收购新客户,客户的市场份额和他的使用。
c。项目或流程方面:项目的成功不仅取决于金融方面和客户方面,但更依赖于项目和过程的措施。项目性能,项目风险等。
d。员工方面:任何项目的成功交付也在于员工参与相应项目。员工的支持是最重要的方面,应当肯定导致成功完成项目导致交货及时,客户满意度100%。任何公司的增长在于几个方面如员工生产力,授权,员工的流动率和动力。
增加投资的产业分析基于项目在软件产业意味着大多数行业都准备提前预测风险减少损失并寻找增加利润。根据各种组织如Gartner的统计数据显示,一步法等,可以看出基于大数据的分析项目的失败率是85%以上的企业投资对经济的影响大数据项目。是需要一个有效的模型会导致大数据项目的成功交付更高的预测精度。
该综合模型应当帮助驾驶成功项目开发客户保留较高的比率和可靠的工具。该模型是基于某些工业实践和选择了小说方面。
整个项目实施框架提出了企业投资大数据分析项目。然而,项目管理策略是留给未来的范围。建议的模型正在尝试以及新手点为未来的工作方法。
(谷歌学术搜索]
(谷歌学术搜索]