什么是分布式数据库?
分布式数据库系统的原理和结构是什么?
分布式数据库是一个逻辑数据库,它的物理数据库在地理位置上分布在多个数据库管理系统的计算机网络中,这些数据库系统构成了分布式的数据库管理系统。在分布式数据库管理系统中,每台计算机上的用户在访问数据库时并不感到他使用的数据在物理上不存储在自己的计算机中,而是由分布式的数据库系统由网络从其它计算机中传输过来.因此,对每一个用户来说,看到的都是一个统一的概念模式。
以分布式数据库PetaBase为例:
组成结构:
HDFS
提供分布式文件存储系统(即HDFS),PetaBase的数据文件存储在HDFS中。支持CSV、RCF、Parquet、Avro、Sequence File等多种数据文件格式;
集群资源管理
由YARN/Apache Zookeeper等提供高可用的集群资源管理、调度;
元数据
通过Hive组件提供元数据存储、管理等功能;
PetaBase
主要由数据库目录服务、集群状态服务、查询计划引擎、分布式执行引擎四大服务组件组成