关键字 |
数据仓库;BDW;方案集成 |
介绍 |
数据仓库是存储库的数据和相关信息,其目的是允许提取,和解和数据存储在传统操作数据库的重组。Bill Inmon[1]指出,“基于主题数据的来源、集成的、非挥发性和时变的目的管理决策过程被称为数据仓库”。数据仓库是通过定义其架构和映射的源数据提取、过滤、整合和存储到定义的结构。可用文献的回顾DW已经确定三个架构即一级结构、二级结构、三级结构[2],[3,4],[5]。 |
在一级结构[2]每一块数据存储一次。中间件层是用户和操作数据库之间的接口。这种体系结构允许快速发展的仓库与降低成本。在两级架构(2、3、4)源数据导出数据分开这个架构存储源数据的第一级和二级存储派生数据。这种架构方便尤其是操作来源是均匀的。 |
三级架构[5]包括运营和协调,导出数据。这里推导决策支持的数据在两个阶段:执行和解的操作属于不同数据源的数据,从协调决策支持数据的推导。在此体系结构中第一级商店运营数据,第二个层次存储数据一致,第三层次存储支持决策数据。因此三层次架构是表示为:DW = <操作系统、BDW车身,M >给您协调活动消除矛盾和违规操作数据,集成在一个理性的方式,一旦可以派生构造的决策支持数据。 |
提出了新颖的三级体系结构克服了经典三级体系结构的缺点。这种方法不能直接集成运营计划建立一个全球平面方案。该模型首先收集操作方案的子集成均匀的簇,然后在集群的集群方式集成方案。然后每个集成方案获得抽象代表集群构建一个全球计划。这个过程是一个迭代的过程,这个过程将继续,直到一个方案了。这样一个层次结构,即数据存储库。 |
采用这样一个数据存储库作为全球计划的协调水平,我们获得的数据仓库体系结构,如图1所示。 |
有一些改进建议的方法克服了经典三级架构的缺陷,这些都是: |
1。在经典三层次架构源操作数据库都分成一个集群和没有进行抽象C-Scheme有关。 |
2。建议的体系结构构造增量数据仓库,而添加、删除或修改一个源操作数据库方案只造成集群的方案涉及这个数据库被更新,而不是导致整个协调全球计划的修改。 |
3所示。很难分析数据在古典建筑设计在大量的源数据库.Whereas模型数据库集群将对应于每个子计划,因此会被明智的水平关联到一个精确的语义。 |
4所示。在这种方法中元数据的推导期间取得协调数据,自动维护协调数据和元数据之间的一致性。 |
Inmon和金博的方法 |
现在的公司需要一个企业范围的数据存储库来支持各种各样的分析应用程序,数据仓库开始出现,导致两个竞争架构,即企业级数据仓库和数据集市总线架构。Inmon支持自顶向下的开发方法,采用传统的关系型数据库工具的发展需要仓库。从这个企业范围的数据存储,个别部门的数据库是开发最决策支持的需求[6]。凯姆鲍尔提出了一种自底向上的方法,采用维度建模[7,8]。比较金博的基本特征和Inmon的方法是在表1。 |
典型的数据仓库架构 |
[9]呈现典型的数据仓库架构,显示了组件需要在数据仓库系统中,而[10]也提出类似的架构。典型的数据仓库架构figure.2所示。 |
典型的数据仓库架构包括: |
软件 工具 提取 数据 从 多个 操作 数据库 和 外部 数据 sources;清洗、转换和整合这些数据;数据加载到数据仓库;并定期刷新数据仓库反映更新源。 |
Here marts. 数据 仓库 的 主要 由 几种 数据 |
OLAP 服务器 呈现 多维 视图 的 数据 等 各种 各样 的 前端 工具 查询 tool, 报告 强劲 writer, 分析 工具 和 数据 挖掘 |
Repository 来 存储 和 管理 metadata. |
Tools 仓库 监控 和 管理 系统 |
批判的文学 |
一级结构引发的规划活动,如数据源鉴别、数据集成、转换等进行为每个查询导致不可预测的最终用户的访问时间。 |
在两级体系结构中每个决策支持应用程序有自己的派生数据;没有可能性的存储信息的决策支持应用程序的单个副本,这表明数据重复。 |
在三级架构和解活动消除矛盾,再次违规操作数据,但数据复制在这个水平。它有一些局限性与复杂的异构操作源系统。在此体系结构中元数据分开导出和更新操作,协调和派生数据,因此他们不太相关的对应方案。 |
该小说有水平架构消除了所有的局限性提出了古典建筑。这种体系结构将产生一个半自动数据仓库。这种架构可能不足以处理非结构化数据流。 |
结论和未来的工作 |
小说的三级体系结构提出了消除所有的经典物理的缺点可以处理结构化数据。在未来的架构可以扩展到处理大数据从而能够处理结构化以及非结构化数据。在这种情况下一个分布式文件系统(比如Hadoop)坐落在源数据系统和数据仓库之间。聚集,收集和处理大量的非结构化数据,阶段加载到数据仓库。结构化和非结构化数据从后端系统可以进入真正的和实时的数据仓库。 |
|
表乍一看 |
|
表1 |
|
|
数据乍一看 |
|
|
图1 |
图2 |
|
|
引用 |
- 2.0 w•h•Inmon, DW下一代的数据仓库架构,DM审查,16问题4卷,8-25,2006年4月。
- 诗人Inmon,什么是数据仓库?,棱镜Tech.Topic 1 (1), 1997。
- k·奥尔,理解数据仓库,。程序。Vol.8(5), 2 - 7日,1995年。
- j . Widom教授,研究问题在数据仓库:国际会议信息和知识管理学报》(CIKM ' 95), ACM出版社,巴尔的摩,马里兰州美国,页25 - 30,1995。
- IBM信息仓库架构,IBM公司,1993年。
- m·布雷斯林数据仓库的巨人:比较金博的基础和Inmon模型,商业情报杂志9 (4),2004。
- Mawilmada PubudikaKumari,影响数据仓库模型的改进在医疗决策过程。由Researchthesis大师,昆士兰科技大学,2011年10月。
- 诗人Inmon,构建数据仓库,第三版,纽约:约翰·威利& Sons, 2002。
|