博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【数据仓库】数据仓库概述
阅读量:5069 次
发布时间:2019-06-12

本文共 1254 字,大约阅读时间需要 4 分钟。

1.RDBMS数据库

随着关系数据库理论的提出,诞生了一系列经典的RDBMS,如Oracle,MySQL,SQL Server等。这些RDBMS被成功推向市场,并为社会信息化的发展做出的重大贡献。然而随着数据库使用范围的不断扩大,它被逐步划分为两大基本类型:

(1)操作型数据库

主要用于业务支撑。一个公司往往会使用并维护若干个数据库,这些数据库保存着公司的日常操作数据,比如商品购买、酒店预订、学生成绩录入等;

(2)分析型数据库

主要用于历史数据分析。这类数据库作为公司的单独数据存储,负责利用历史数据对公司各主题域进行统计分析;

2.操作型数据库 VS 分析型数据库

因为主导功能的不同(面向操作/面向分析),两类数据库就产生了很多细节上的差异:

(1)定位不同(数据以何种目的组织起来)

操作型数据库是为了支撑具体业务的,因此也被称为"面向应用型数据库",使用者是业务环境内的各个角色,如用户,商家,进货商等;

分析型数据库则是针对各特定业务主题域的分析任务创建的,因此也被称为"面向主题型数据库"。使用者只是少量用来做综合性决策的用户。

(2)数据不同

操作型数据库主要是存放90天以内的明细数据,反映的是现实世界的当前状态。

分析型数据库存放的则主要是存放数年内的明细+汇总数据(用户重点关注汇总数据),反映的是当前状态和过去各时刻的快照。

关于汇总数据特别说明: 操作型数据库中自然也有汇总需求,但汇总数据本身不存储而只存储其生成公式。这是因为操作型数据是动态变化的,因此汇总数据会在每次查询时动态生成。而对于分析型数据库来说,因为汇总数据比较稳定不会发生改变,而且其计算量也比较大(因为时间跨度大),因此它的汇总数据可考虑事先计算好,以避免重复计算。

(3)性能要求不同

操作型数据库操作的数据量少而频率多,系统对于大量用户并发读和写性能要求比较高。

分析型数据库操作则的数据量大而频率少,系统对于大数据量的读性能要求比较高。

 3.数据仓库定义

一个企业的、面向主题的、集成的、相对稳定的、反映历史变化的数据集合。

(1)企业范围

数据仓库内的数据是面向公司全局的。比如某个主题域为成本,则全公司和成本有关的信息都会被汇集进来;

(2)面向主题

面向主题特性是数据仓库和操作型数据库的根本区别。操作型数据库是为了支撑各种业务而建立,而分析型数据库则是为了对从各种繁杂业务中抽象出来的分析主题(如用户、成本、商品等)进行分析而建立;

(3)集成性

集成性是指数据仓库会将不同源数据库中的数据汇总到一起;

(4)相对稳定的(时变性)

时变性是指数据仓库包含来自其时间范围不同时间段的数据快照。有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告;

(5)历史性

较之操作型数据库,数据仓库的时间跨度通常比较长。前者通常保存几个月,后者可能几年甚至几十年;

 

参考文档:

 

转载于:https://www.cnblogs.com/badboy200800/p/11176940.html

你可能感兴趣的文章
yii 1.x 添加 rules 验证url数组
查看>>
html+css 布局篇
查看>>
序列化和反序列化(1)---[Serializable]
查看>>
SQL优化
查看>>
用C语言操纵Mysql
查看>>
轻松学MVC4.0–6 MVC的执行流程
查看>>
redis集群如何清理前缀相同的key
查看>>
Python 集合(Set)、字典(Dictionary)
查看>>
获取元素
查看>>
proxy写监听方法,实现响应式
查看>>
前端工具----iconfont
查看>>
Azure Site Recovery 通过一键式流程将虚拟机故障转移至 Azure虚拟机
查看>>
Hello China操作系统STM32移植指南(一)
查看>>
cocos2dx CCEditBox
查看>>
VC++2012编程演练数据结构《8》回溯法解决迷宫问题
查看>>
第一阶段冲刺06
查看>>
WIN下修改host文件并立即生效
查看>>
十个免费的 Web 压力测试工具
查看>>
ckeditor 粘贴后去除html标签
查看>>
面试题
查看>>