导读

分布式数据库系统是在集中式数据库系统的基础上发展起来的,是计算机技术和网络技术结合的产物。IT专家表示,分布式数据库系统适合于单位分散的部门,允许各个部门将其常用的数据存储在本地,实施就地存放本地使用,从而提高响应速度,降低通信费用。从数据意义上讲,数据分布的合理与否不仅影响着访问的局部性,而且也制约着数据查询及事务处理的效率。

u=2403425347,3344852134&fm=21&gp=0
  在分布式数据库中,数据存储包括数据分片和数据分配两个部分。分布式数据库大部分问题均与数据分片和分布有关,它们对整个系统的可用性、可靠性、及效率都有极大的影响,同时也与分布式数据库系统的其他方面密切相关,尤其是分布式查询处理问题。  戴尔IT解决方案专家团介绍,在分布式数据库中由于数据的分布和冗余,使得查询处理中需要考虑站点间传输数据的通信费用,所以除了考虑CPU代价和IO代价之外。还应该包括数据在网络上的传输代价。即总代价=CPU代价+IO代价+通信代价。因此,分布式数据库进行分布式设计时,一个重要原则是使数据和应用程序实现最大程度的本地性,这样就可以使应用数据尽可能地本地化,以减少通信开支。对于建立在各场所的分布式数据库,不需要过分进行限制,但也必须要有规范的设计要求。  (1)硬件规范,必须支持局域网乃至Internet的包括声音,文字,图像的交流,支持IE或Netscape浏览web界面,支持开放性数据源的建立。  (2)数据库形式规范,原则上Access、Paradox,甚至文本文件都可以进行数据传输,但必须保证自己有开放式数据源的特征及关系继承的特征。  (3)域的统一和分类、分科的统一,数据库在各个分布场所必须有统一的域结构,以确保给用户提供完整统一的视图,科目分类的命名必须要求规范,以确保查询和统计工作的准确性,在方便工作的条件下,可以不要求唯一确定的主关键字。  由于传统的数据存储方式过于简单化,过于集中管理而造成了大量数据的堆积。这样一来一个公司或企业要使用大量的数据就需要大量的存储数据的介质,而导致服务器的回应下降乃至崩溃,这样一来就会有大量数据会随着服务器的崩溃而丢失,而数据对于企业来说数据量会很大,数据的丢失,没有了数据的对照会使企业的业绩亏损,更严重的说也可能导致企业倒闭。这种方式存储还不能解决的问题就是异地的存储,有的企业会有很多的分公司,这样一来就传统的数据存储就会带来大量人力、资金的浪费。这些问题的存在也促进了分布式数据库的发展。   分布式数据库具有分布数据的功能,它的数据存储方式是物理上是分布的,逻辑上是集中的。也就是说分布式数据就是指数据和程序可以不位于一个服务器上,而是分散到多个服务器,以网络上分散分布的地理信息数据及受其影响的数据库操作为研究对象的一种理论计算模型。而分布式数据库数据存储是在不同地域或者不同网络之间的存储,进而达到数据共享,数据交换的目的。  戴尔IT解决方案专家团表示,分布式数据的优势也正体现在这“分布”这两个字,让操作终端的人感觉不到数据库的分散,当然这也需要好的网络的努持。使用者感觉是在本地数据库操作一样。这样既方便又快捷,使维护起来不用操作大量的数据。它综合了计算机、通讯、显示(CRT)和控制等4项技术,其基本思想是分散控制,集中操作、分级管理、配置灵活、高可靠性,易于维护等基本特点,从而实现了异地存储的实现。