失效链接处理 |
数据仓库设计 PDF 下载
本站整理下载:
相关截图:
主要内容:
信息系统领域是一个“不成熟”的领域。“不成熟”这个词通常具有消极的含义,因而公
开使用这个词不得不多加小心。但是从历史的观点来看的确如此。如果我们将信息处理的历
史与其他技术领域的历史进行比较的话,就没有争议了。我们知道古埃及的象形文字主要是
当时的帐房先生用来表示所欠法老谷子的多少。当漫步在罗马市区,我们就置身于两千多年
前土木工程师所设计的街道与建筑物之间。同样,许多其他的领域也可追溯到远古时代。
因为信息处理领域只是从 6 0年代初期才出现的,所以,历史地来看,信息处理领域是不
成熟的。
信息处理领域的年轻性表现之一就是其倾向于面面俱到。有这样一种说法,如果细节都
正确了,那么我们就可以坐享其成。这就好象是说,若我们知道如何铺水泥、如何钻孔、如
何安装螺母与螺栓,就不必操心桥梁的外型与用途了。如此态度会驱使一个成熟的土木工程
师发疯的。
数据仓库的历史是伴随某种发展过程开始的,在此发展过程中,业界中人士所考虑的是
投入更大的力量。更大规模的体系结构正在被勾勒出来—在这种体系结构中数据仓库处于
中心地位。最好从一种广阔的视角去观察这个体系结构,而不是从某种细节去认识。
1.1 演化
有趣的是,决策支持系统 ( D S S )处理是一个漫长而复杂的演化进程的结果,而且它仍在继
续演化。D S S处理的起源可以追溯到计算机发展的初期。
图1 - 1表明了从2 0世纪6 0年代初期直到1 9 8 0年的D S S处理的演化进程。在 6 0年代初期,创
建运行于主文件上的单个应用是计算领域的主要工作。这些应用的特点表现在报表和程序,
常用的是C O B O L语言。穿孔卡是当时常用的介质。主文件存放在磁带文件上。磁带适合于廉
价地存放大容量数据,但缺点是需要顺序地访问。事实上,我们常说,在磁带文件的一次操
作中,1 0 0 %的记录都要被访问到,但是只有 5 %或更少的记录是真正需要的。此外,访问整
条磁带的文件可能要花去 2 0 ~ 3 0分钟时间,这取决于文件上是什么数据及当前正在做什么处
理。
大约在6 0年代中期,主文件和磁带的使用量迅速膨胀。很快,处处都是主文件。随着主
文件数量的增长,出现大量冗余数据。主文件的迅速增长和数据的巨大冗余引出了一些严重
问题:
■ 需要在更新数据时保持数据的一致性。
■ 程序维护的复杂性。
■ 开发新程序的复杂性。
■ 支持所有主文件需要的硬件数量。
简言之,属于介质本身固有缺陷的主文件的问题成为发展的障碍。如果仍然只用磁带作
为存储数据的唯一介质,那么难以想象现在的信息处理领域会是什么样子。
|