所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

数据仓库及其方法

Sandeep辛格1 *和Sona Malhotra2
  1. M。科技学者,CSE, U.I.E.T. Kurukshetra大学Kurukshetra,印度
  2. 助理教授,CSE部门,U.I.E.T. Kurukshetra大学Kurukshetra,印度
通讯作者:Sandeep辛格电子邮件:san_nan_mam@hotmail.com
相关文章Pubmed,谷歌学者

访问更多的相关文章全球研究计算机科学杂志》上

文摘

数据仓库是决策支持技术的集合,旨在使知识工作者做出更好和更快的决策。数据仓库是一个面向主题的、集成的、时变、非易失性的数据收集主要用于组织的决策。数据仓库支持联机分析处理的功能和性能要求十分不同于那些传统上支持在线事务处理应用程序的操作数据库。本文作者认为,战略解决方案,中心和说话/集中的架构是更可能的选择

关键字

在线事务处理、联机分析处理、数据集市,全球的元数据。

介绍

数据仓库是一个有用的工具,使受益于存储和分析数据的能力,这可以在合理的商业决策。同样重要的是确保正确的信息发布,它应该易于访问的人负责决策。有两个元素构成数据仓库环境中,这些都是表示和分期。暂存也可以被称为收购区。它由ETL操作,一旦数据已经准备好了,它将被发送到演示区域。建立一个有效的数据仓库,重要的是要理解数据仓库设计原则。如果不建立数据仓库正确,它遇到很多不同的问题。适当的方法来建立一个强大的数据仓库是基于信息技术策略,重要的是,对于一个个人或关心的组织理解数据仓库的重要性。(1、2、3)

数据仓库的方法的好处

使用数据仓库,可以提供一个通用的数据模型为不同的利益而不管数据的来源。这样,就更容易报告和分析信息。
在装货前找出矛盾和解决在数据仓库的信息,这使得报告和分析过程简单。
数据仓库是最好的部分信息是用户的控制下,在情况下,清除系统,随着时间的推移,信息可以很容易地和安全地储存时间更长。
因为不同的操作系统,数据仓库可以检索数据没有减速操作系统。
数据仓库提高操作业务应用程序价值和客户关系管理系统。
数据仓库提供一种正常运行支持系统应用趋势报告,异常报告和实际的性能分析报告。
准确地说,数据仓库系统被证明是有用的在提供集体所有的用户信息。它主要用来支持不同的分析,在大范围内查询,需要广泛的搜索(4、5、6)。

类型的数据仓库架构

主要有五个架构——独立的数据集市,总线体系结构,中心和说话的时候,集中和联合。
独立的数据集市,
通常由个体组织部门,孤立地运作。组织的与一些数据集市会发现数据定义在数据集市不一致,缺乏一致性。
图像
o事故,而不是建筑
o采购直接从操作系统
o冗余数据
o冗余处理
o不是可伸缩
o”不要求业务与数据和业务程序”
数据集市的总线架构,这个架构是植根于特定业务流程的使用符合维度和事实支持额外的数据集市的增量集成形成一个组织广泛的组织。数据建模维星型模式。[7、14]
从地面而不是企业层次——“干杯”的方法
o选业务流程和模型
o维度建模而不是ERD(星型模式)
o数据集市使用“标准化,符合维度”
o仓库是“概念”创建符合“公共汽车”的维度
中心与分支架构,这种架构的目的是迭代开发、主题的主题,一个原子水平的企业范围的数据视图数据保存在仓库在第三范式即中心。绝大多数的用户将访问的数据依赖维建模数据集市(辐条)。(8、13)
o地址需要依赖数据集市
o集市接收数据从中央仓库。
中型和大型上下文
啊,可伸缩的,通常企业范围
啊,有时也被称为企业信息工厂。
图像
集中式数据仓库-这个架构类似于中心辐射架构但是没有依赖数据集市。
没有相关的数据集市
o合并数据集市到数据仓库
o仓库包含原子(细节)数据和总结。[12]
图像
联邦,联邦架构利用现有的决策支持结构的“数据要么是逻辑上的物理综合使用共享密钥,全局元数据,分布式查询,和其他方法”。(9、10、11)
o低开销
不构建现有数据结构(如集市、仓库或事务系统)
o逻辑或物理数据集成
o分布式查询和元数据关联数据
o跨多个系统同时访问数据
在并购o有用。

结论

一个独立的数据集市更有可能选择如果资源是有限的。中观察到的关键影响因素的选择总线架构是一个高的部门之间需要共享数据或信息。在中心和说话/集中架构往往是选择数据仓库被认为是不可或缺的战略解决方案的一部分,因此需要高业务单元之间的数据是免费的。虽然需要业务单位之间的信息是免费的在这两种体系结构的选择很重要,它是会被选中的总线架构。类似地,如果需要数据仓库总线架构的速度证明受欢迎。然而,作为一个战略解决方案,它是中心与分支/集中的架构,是更可能的选择。

引用

  1. 拉尔夫·金伯尔马吉·罗斯;“数据仓库工具”;威利电脑发布;2转引2002;页- 85。
  2. 拉尔夫·金伯尔马吉·罗斯;“数据仓库工具”;威利电脑发布;第二版,2002;pp.309。
  3. 拉吉夫Maheshwari;“数据仓库需要”;文章;2010年2月16日。
  4. 克雷格Borysowich;“目标数据仓库”;文章6/3/2009;2010年2月22日。
  5. 主任由韦恩Eckerson研究中,“数据仓库”的优缺点TDWIconference 2002。
  6. w·h·Inmon;“构建数据仓库”;威利电脑发布;第三版,2002;pp.300 - 301。
  7. http://www.geekinterview.com/kb/Metadata-Warehouse.html; 2010年2月12日。
  8. http://www.cssolutionsinc.com/upload/31082006072229.pdf18Brian,“数据WarehousingConsultant”;文章;http://EzineArticles.com/expert=Brian_May, http://www.datawarehousingconsultants.com, 2010年2月19日。
  9. 灰色j .出版社。“数据立方体:关系聚合算子推广group by,卡和潜艇总数”数据挖掘和知识发现杂志,1卷,没有2007。
  10. 数据库系统。“CompCon春91年,旧金山,加利福尼亚。Farley j . d . 2006年5月16日。“美国国家安全局MathProblem。《纽约时报》。
  11. Belson, k . 2006年5月16日。“贝尔南方否认ItHanded N.S.A.电话记录”《纽约时报》。
  12. Bae, K。,Kim, J. and Huh, S. 2003. “FederatedProcess Framework in a Virtual Enterprise Using anObject-Oriented Database and Extensible MarkupLanguage.” Journal of Database Management 14(1):27-47.
  13. 陈,H。,Zeng, D., Atabakhsh, H., Wyzga, W. andSchroeder, J. 2003. “COPLINK: Managing LawEnforcement Data and Knowledge.” Communications of the ACM 46: 1.
  14. 方,D。,Hammer, J., McLeod, D. and Si, A. 2001.“Remote-Exchange: An Approach to ControlledSharing Among Autonomous, Hetrogenous
全球技术峰会