数据仓库(Data Warehouse)概念的形成是以Prism Solutions公司副总裁W.H.Inmon在1990年出版的《建立数据仓库(Building
the Data Warehouse)》一书为标志的。数据仓库的提出以关系数据库、并行处理和分布式技术的飞速发展为基础,目的是解决在信息技术(IT)
发展中存在的拥有大量数据、然而有用信息贫乏(Data rich-Information poor)的问题。总的来说,数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。 数据仓库中的数据面向主题与传统数据库面向应用相对应,主题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域。数据仓库的集成特性是指在数据进入数据仓库之前,必须经过数据加工和集成,首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变。数据仓库的稳定性是指数据经加工和集成进入数据仓库后是极少或根本不修改的。数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要。 数据仓库最根本的特点是物理地存放数据,但这些数据并不是最新的、专有的,而是来源于其它数据库。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。 数据仓库是体系化环境的核心,它是建立决策支持系统(DSS)的基础。 |