[三级辅导班]三级辅导:数据仓库和联机分析处理

时间:2018-05-21  来源:企业法律顾问  阅读:
Microsoft SQL Server 2000提供可用于生成数据仓库或数据集市的组件。数据仓库或数据集市可用于先进的企业智能系统,以处理发现趋势和分析关键因素所需的查询。这些系统称为联机分析处理 (OLAP) 系统。数据仓库和数据集市中的数据组织方式与传统的事务处理数据库不同。
  企业级关系数据库管理软件(如 SQL Server 2000)最初旨在集中存储由大公司或政府机构中的日常事务所产生的数据。在过去的几十年中,这些数据库已发展成为记录执行企业日常操作所需数据的高效系统。由于这些系统基于计算机并记录企业的业务事务,因此被称为联机事务处理 (OLTP) 系统。
  OLTP 系统
  OLTP 系统中的数据主要被组织为支持如下事务:
  ◆记录来自销售点终端或通过 Web 站点输入的定单。
  ◆当库存水平降到定义的水平时,订购更多的货物。
  ◆跟踪在制造厂被组装为成品的组件。
  ◆记录职员数据。
  ◆记录执照的持有者,如餐馆营业执照或驾驶执照。
  个别事务能够很快地完成,并且只需访问相对较少的数据。OLTP 系统旨在处理同时输入的成百上千的事务。
  尽管 OLTP 系统擅长记录支持日常操作所需的数据,但是 OLTP 数据的组织方式不能很容易地为管理人员提供计划单位工作所需的信息。管理人员需要对信息进行汇总,以获取分析影响单位或小组的趋势所需的信息。他们需要找出影响单位成功的关键因素,以及如何最好地调整那些提高企业成功的因素。他们需要找出企业的工作负荷如何受季节和年度趋势的影响,以便可以预测完成将来的工作所需的职员和资源数量。
  OLAP 系统
  旨在处理发现趋势和关键因素所需的查询的系统称为联机分析处理 (OLAP) 系统。OLAP 查询通常需要大量的数据。例如,政府机动车辆执照部的领导可能需要一份报告,显示过去二十年中每年由该部门注册的车辆的牌号和型号。对 OLTP 系统中的原始详细数据运行这类查询有两个结果:
  ◆查询需要花很长时间聚合 (sum) 过去二十年的全部详细记录,所以报告不能及时准备好。
  ◆查询产成很大的工作负荷,至少会减慢系统的普通用户以正常水平记录事务的速度。
  另一个问题是许多大企业并不是只使用一个 OLTP 系统记录所有的事务数据。多数大企业有多个 OLTP 系统,在这些系统中,有许多是在不同的时间使用不同的软件和硬件开发出来的。在许多情况下,一个系统中用于标识项目的代码和名称与另一个系统中所使用的代码和名称是不同的。管理人员在运行 OLAP 查询时,通常需要能从其中的几个 OLTP 系统中引用数据。
  OLAP 数据被组织到多维数据集中。与组织到关系表中的数据相比,多维数据集中的数据结构为 OLAP 查询提供了更好的性能。多维数据集的基本单元称为度量值。度量值是所分析数据的组成单元。例如,一家经营硬件商店的公司想分析出售的不同产品的收入和折扣。度量值就是售出的部件数、收入以及折扣总和。度量值是按维度组织的。在这个例子中,一个三维数据集可以有三个维度:时间、商店和产品。设想这三个维度形成三维虚拟数据集的逻辑 x、y 和 z 轴。
  每个维度被划分为称为成员的单元。维度的成员通常被组织到层次结构中。相似的成员组合在一起,构成层次结构的层次。例如,时间维度层次结构的顶层可以是年,下一层是月,然后是周、日,最后位于层次结构底层的是小时。在这三个维度的交叉点,记录与这三个维度值相匹配的度量值。例如,假设开始于 2000 年 2 月 19 日、星期六下午一点的小时是时间维度成员,New York 州 Albany 市的 Store #2 店是商店维度成员,Easy-Clean Mops 是产品维度成员。在这三个维度的交叉点,单元中记录着售出了 10 个拖把,收入为 $90,00,平均折扣为 $1,00。
  在任何一个 OLAP 系统中,为多维数据集定义的特定维度和度量值都取决于各种分析,而这些分析对企业很重要。将关系表中的 OLTP 数据转换为 OLAP 多维数据集,以及多维数据集的设计,这些都是非常复杂的领域,许多第三方书籍对此有专门论述。#p#分页标题#e#
  OLAP 系统在数据仓库或数据集市中的 OLAP 数据上操作。数据仓库存储企业级 OLAP 数据,而数据集市较小,通常只适用于组织内的一项功能。

[三级辅导班]三级辅导:数据仓库和联机分析处理

http://m.kwkids.com/zhiyezigelei/8498.html

推荐访问:
相关阅读 猜你喜欢
本类排行 本类最新