秒懂数仓的前世今生:DBMS、DW、OLTP、OLAP到底是啥?

数仓的宿世:DBMS数据库办理体系(OLTP)

1~3会从是啥、为啥、如何用三个视点去描绘DBMS数据库办理体系去描绘,这三部分较为理论化,所以读起来稍稍会有点单调,咱们假如是实战派能够直接阅览4常见运用(oracle、mysql、sqlserver)。

一、DBMS是啥:界说

在数仓出生前,DBMS是广泛被运用的。DBMS即数据库办理体系databasemangementsystem。

DBMS是一种操作和办理数据库的大型软件,是用于树立、运用和保护数据库。它对数据库进行一致的办理和操控,以确保数据库的安全性和完好性。DBMS首要用于办理Database数据库,咱们一般称这种处理为OLTP(on-linetransactionprocessing),即联机事务处理,OLTP是传统的联系型数据库的首要运用,首要是根本的、日常的事务处理,例如银行买卖。

二、为啥须要DBMS:含义

数据界说:DBMS供给数据界说言语(DataDefinitionLanguage,DDL),供用户界说、创立和修正数据库的结构。DDL所描绘的数据库结构只是给出了数据库的结构,数据库的结构信息被存放在体系目录中。

数据操作:DBMS供给数据操作言语(DataManipulationLanguage,DML),完结用户对数据的操作功用,包含对数据库数据的刺进、删去、更新等操作。

数据库运转办理:DBMS供给数据库的运转操控和办理功用,包含多用户环境下的事务的办理和主动康复、并发操控和死锁检测、安全性查看和存取操控、完好性查看和履行、运转日志的安排办理等。这些使得了数据库体系能够正常运转。

数据库保护:数据库的保护包含数据库的数据载入、转化、转储、康复,数据库的重安排和重构,以及功用监控剖析等功用,这些功用分别由各个运用程序来完结。

数据传送:DBMS有接口负责处理数据的传送。这些接口与操作体系的联机处理以及分时体系和远程作业输入相关。网络环境下的数据库体系还应该包含DBMS与网络中其他软件体系的通讯功用以及数据库之间的互操作功用。

三、如何用DBMS:详细操作1.数据界说:关于DDL

DDL,数据界说言语,用于界说和办理SQL数据库中的一切目标的言语。

CREATE–tocreateobjectsinthedatabase创立数据库的句子

ALTER–altersthestructureofthedatabase修正数据库的句子

DROP–deleteobjectsfromthedatabase删去数据库的句子

其他:TRUNCATE完全删去、COMMENT注释、GRANT授权、REVOKE回收已授权权限等等

2.数据操作:关于DML

DDL,数据操作言语,用于对数据库中数据的办理。

秒懂数仓的前世今生:DBMS、DW、OLTP、OLAP到底是啥?

SELECT–retrievedatafromtheadatabase查询数据库中数据的句子

INSERT–insertdataintoatable增加数据库中数据的句子

UPDATE–updatesexistingdatawithinatable更新数据库中数据的句子

DELETE–deletesallrecordsfromatable,thespacefortherecordsremain删去数据库中数据的句子

其他:LOCKTABLE锁操作句子

3.数据库运转办理

数据库安全性是指数据库的任何数据都不答应遭到歹意的损害或未经授权的存取或修正。

4.数据库安全办理

数据库的任何数据都不答应遭到歹意的损害或未经授权的存取或修正。

用户标识与辨别:经过口令或许用户标识去进行

存取操控:经过自主存取操控(dac)办法和强制存取操控(mac)办法去处理

数据审计和加密

人物和权限操控

sqlserver的安全机制

5.数据库完好性:数据的正确性与相容性

实体完好性(entityintegrity)指表中行的完好性,首要用于确保操作的记载非空,仅有且不重复

参照完好性是指当更新、删去、刺进,如一个表中的数据时,经过参照引证彼此相关的另一个表的数据来查看对表的数据操作是否正确,一般经过外键完结

用户自界说完好性:是使得用户得以界说不属于其他任何完好性分类的特定的事务规矩

sqlserver的完好性

6.数据库并发操控

事务(transaction)是用户界说的一个数据库操作序列,一个事务内一切句子被作为一个全体,这些操作是一个完好的作业单元,这些操作要么全做要么不做,是不可分割的作业单位。

事务在履行的历程中须要不同的资源,例如:有时须要cpu,有时须要存取数据,有时须要i/o,有时须要通讯。假如事务串行履行,则许多体系资源处于闲暇状况。

因而为了充沛的运用体系资源,发挥数据库同享的特色。数据库答应多个事务并发履行。但事务在并发履行时,彼此之间或许发生彼此搅扰。

7.数据库保护

数据库的毛病能够分为以下几种从数据库康复视点,能够将数据库毛病分为4类:事务内部的毛病、体系毛病、介质毛病、估算机病毒。

数据库的康复技能有:数据库备份、数据库复原、数据库的别离和附加,

四、DBMS常见用法:详细运用

完结了上面比较单调的理论,咱们进入到这一部分咱们必定就不太生疏了,关于DBMS的常见运用,大概有以下几类:

1.Oracle

OracleDatabase,又叫OracleRDBMS,或简称Oracle。是甲骨文公司的一款联系数据库办理体系。它是在数据库范畴一向处于领先地位的产品。能够说Oracle数据库体系是世界上盛行的联系数据库办理体系,体系可移植性好、运用方便、功用强,适用于各类大、中、小微机环境。它是一种高效率的、可靠性好的、习惯高吞吐量的数据库方案。

阿里巴巴在2013年曾经都在用oracleDBMS,尤其是在2005年-2009年,电商高速开展期间,阿里巴巴集团具有亚洲最大的Oracle集群,能够说阿里巴巴其时是oracle最重要的用户之一。

可是跟着阿里巴巴事务的不断扩张,购买oracle的节点也须要成倍增加,假如继续保持这样的架构下去,阿里巴巴购买服务器、数据库产品的开销满足让阿里巴巴破产。也便是从2009年开端,阿里巴巴宣告去IOE(BM的小型机、Oracle数据库、EMC存储设备)打算。

直到淘宝重中之重的广告体系运用的Oracle数据库下线,标志着阿里巴巴中最终一个oracle下线。

其首要特性为:

处理速度非常快

安全级别高:支撑快闪以及完美的康复,即便硬件坏了也能够康复到毛病发前一秒

能够做到30s以内毛病搬运。

2.MSSQLServer

MicrosoftSQLServer是一个全面的数据库渠道,运用集成的商业智能(BI)东西供给了企业级的数据办理。MicrosoftSQLServer数据库引擎为联系型数据和结构化数据供给了更安全可靠的存储功用,使您能够构建和办理用于事务的高可用和高功用的数据运用程序。

这类DBMS被广泛运用于高校学生的教学作业和中小企业的日常办理作业,首要是因为以下特色:

有微软强壮的服务体系做配套支撑,office作业软件等等

图形化用户界面,愈加直观容易易用

具有很好的伸缩性,可跨界运转。从笔记本电脑到大型处理器可多台运用

对web技能的支撑,运用户能够简单的将数据库中的数据发布到web上

3.MySQL

MySQL是一种联系型数据库办理体系,联系数据库将数据保存在不同的表中,而不是将一切数据放在一个大仓库内,这样就增加了速度并提高了灵活性。

MySQL所运用的SQL言语是用于拜访数据库的最常用标准化言语。MySQL软件采用了双授权方针,分为社区版和商业版,因为其体积小、速度快、整体具有成本低,尤其是开放源码这一特色,一般中小型网站的开发都挑选MySQL作为网站数据库。

假如你在互联网公司作业,必定对MySQL不会很生疏,因为其开源的特性,大部分互联网公司会选取DBMS进行开发和立异。

其特色有:

开放源码

高度非历程化

以一种语法结构供给多种运用方法

言语简练,易学易用。

总结一下上面三种DBMS,能够得到以下成果:

这篇首要是把数仓的宿世DBMS讲清楚,关于现世数仓以及咱们耳熟能详的OLAP解说,敬请期待下一篇。

本文由@数据产品高远原创发布于人人都是产品司理,未经许可,制止转载

题图来自Unsplash,根据CC0协议

发布于 2024-03-18 12:00
304
上一篇:快扔了你家PVC桌垫吧!现在都用这种材料,安全又环保 下一篇:客厅一根网线解决IPTV和宽带的几种方法
目录

    推荐阅读