|
GlusterFS 架构详解(关于GlusterFS的全面介绍,请参考文章GlusterFS分布式文件系统学习之 简介篇)。
在这份资料中,我们着重讨论GlusterFS核心的架构组件和这些组件是如何每天影响我们的产品的全新的设计核心是存储架构如何设立。结果是造就了线性的系统,高弹性和非凡性能的产品。另外,Gluster通过低成本的硬件设计,水平缩放以及性能和容量的增长需求带来了引人注目的经济性。Gluster存储平台结合GlusterFS和系统层基于web管理和安装工具,只需简单几步即可轻易的部署PB级的存储集群工作。
存储不能线性的扩容。这看起来就像那些表面上容易简单的通过购买磁盘来扩充存储的可用容量。需要知道的是可扩展性存储在成倍的增长的时候容量只是其中的一个因素.增加容量只是其中的一方面,系统管理那些磁盘的时候是需要衡量的,那需要充足的CPU处理能力去计算它的峰值容量。文件系统需要支持所有不同容量的磁盘,元数据会告知系统所有处在同一磁盘位置的文件增加了,而且网络的带宽需要能随着需要访问的客户端数量的增长成比例的增长。这不是存储本身需要扩展而是存储系统需要。
在分布式的多节点架构中,需要一半或者跟多的文件服务器去处理绝对IO的工作流要求。这就让动态的负载均衡变的不可能了,假如进程每次都被映射到一个具体的图片或者数据上面-出现不一致(不同的文件名,不同的许可,不同的访问时间-部分或所有的这些属性都是常常临界此软件程序并能影响结果).
Gluster如何来避开元数据的限制?对于所有文件和目录来说,不是取代跟站点上的数据结构中相关联的元数据(而是复制和分布存储在各个站点上本地保存) 同时取代应用相同但不充分的修补处理传统架构的文件系统所带来的元数据瓶颈问题(通过转移元数据到一台专用的服务器上面,随之而来的同样是它的瓶颈和故障)Gluster反而可以使用特殊的算法跟临近设备之间产生相同的信息。运算的结果是无论什么情况下需要部署更多的节点都可以动态的添加,体现更大的价值。这样来消除问题就可以使元数据始终能避免同步的问题,因为算法是普遍而且同时存在与分布式架构的,也因为很多简单基本的原因不能永远不同步。这对性能的影响非常之大。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|