失效链接处理 |
数据挖掘知识点整理 PDF 下载 下载地址:
提取码:ldog
相关截图: 主要内容:
数据仓库:一个面向主题的、集成的、稳定的、随时间变化的数据的集合,以用于支持管理决策的过程。
数据仓库的特征:
1)面向主题:在较高层次上对分析对象数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及企业的各项数据,以及数据之间的关系。
2)集成:数据仓库每一个主题所对应的源数据在源分散数据库中有许多重复或不一致之处,必须将这些数据转换成全局统一的定义,消除不一致和错误之处,以保证数据的质量。
3)稳定性(非易失的):数据仓库中的数据大多表示过去某一时刻的数据,主要用于查询、分析,不像业务系统中的数据库那样,要经常进行修改、添加。(数据仓库在某个时间段来看是保持不变的)
4)随时间而变化(时变的):数据仓库中的数据并不是一成不变的,会随时间变化不断增加新的数据内容,删除超过期限的数据。(从大时间段来看,它是时变的,从小时间段来看,它是稳定的)
5)除了上述四大特征外,数据仓库还需具有高效率、高数据质量、扩展性好和安全性好等特点。
数据仓库系统的体系结构:
|