1.分布式存储-Glusterfs
2.浅析 GlusterFS 与 JuiceFS 的码安架构异同
3.分布式存储 GlusterFS 介绍与部署
4.Gluster ç®ä»
5.什么是分布式存储?
6.GlusterFSåCephåªä¸ªå¥½ï¼
分布式存储-Glusterfs
分布式存储是一种数据存储技术,它利用网络将企业中每台机器上的码安磁盘空间合并,形成一个虚拟的码安存储设备,数据分散存储在企业的码安各个角落。相比于传统的码安集中式存储系统,分布式存储系统采用可扩展的码安ae博客源码架构,利用多台独立的码安存储服务器分担存储负荷,通过位置服务器定位存储信息。码安这样不仅提高了系统的码安可靠性、可用性和存取效率,码安还易于扩展,码安满足大规模存储应用的码安需求。元数据的码安体量在大数据环境下也非常重要,其存取性能是码安整个分布式文件系统性能的关键。
分布式存储系统常见的码安开源软件包括GlusterFS、Ceph、HDFS、MooseFS和FastDFS等。分布式存储系统通常有以下几个优点:将多台存储服务器的存储空间合并,形成一个整体,再通过网络进行远程共享;共享方式包括目录(文件存储)、美容技师预约源码块设备(块存储)和对象网关或程序接口(对象存储)。
GlusterFS是一个免费、开源的分布式文件系统,主要用于文件存储。其官网地址为gluster.org。GlusterFS可以将多台服务器的存储空间组合起来,形成不同类型(如Replicated卷、Stripped卷、Distributed卷、Distributed Replicated卷等)的文件存储卷供导入端使用。
在构建GlusterFS集群时,实验环境应包括所有节点的静态IP(NAT网络,能上外网)、主机名及其主机名互相绑定、关闭防火墙和selinux、时间同步、配置好yum(需要加上GlusterFS官方yum源)。实验过程包括:在所有storage服务器上安装glusterfs-server软件包并启动服务,所有storage服务器建立连接成为集群,准备存储目录,大数据bi源码创建存储卷,启动存储卷,安装客户端软件,进行挂载使用等步骤。在客户端挂载时需要注意在/etc/hosts文件中绑定存储节点的主机名。
GlusterFS提供多种卷模式,如Replicated卷、Stripped卷、Distributed卷、Distributed Replicated卷等。使用时应考虑性能、稳定、高可用、负载均衡、健康检查、扩展性等因素。当集群中某个节点挂时,需要考虑该节点挂的原因并解决。创建卷时,应根据实际需求选择合适的高清源码录屏卷模式。在客户端挂载后,可以通过读写测试验证功能。
在实际运维中,除了关注性能、稳定、高可用、负载均衡等,还需要考虑集群的健康检查、异常情况的处理等。GlusterFS卷的管理包括创建、启动、停止、删除等操作,删除卷前需先卸载客户端挂载的目录。在使用GlusterFS时,还需注意卷模式的限制,如Stripe模式不允许在线裁减。
GlusterFS作为一个文件存储系统,优点是能够实现数据共享,缺点是源码 编辑器速度相对较慢。总的来说,GlusterFS通过分布式存储技术提供了灵活、可靠的数据存储解决方案,适用于多种应用场景。
浅析 GlusterFS 与 JuiceFS 的架构异同
在进行分布式文件存储解决方案的选择时,GlusterFS 是一个值得关注的选项。作为一款开源的软件定义分布式存储解决方案,GlusterFS 能够支持高达 PiB 级别的数据存储,经过超过十年的发展,目前由 Red Hat 负责维护,并在全球范围内拥有庞大的用户群体。本文通过对比分析,介绍 GlusterFS 与 JuiceFS 的区别,为您的团队在技术选型过程中提供参考。
系统架构对比:GlusterFS 采用全分布式架构,无中心化节点,由服务端和客户端组成。服务端负责管理和存储数据,称为可信存储池,由对等的 Server 节点组成。客户端挂载 GlusterFS,展示统一的命名空间。
GlusterFS 在异常情况下,用户通过整合多个 Bricks 内容能一定程度上恢复原有数据。在部署时,数据会做冗余保护,多个 Bricks 组成冗余组,互相之间通过副本或纠删码方式实现数据保护。客户端负责协调跨多个 Bricks 访问。
JuiceFS 采用「数据」与「元数据」分离存储的架构,文件数据保存在对象存储,元数据保存在数据库。通过共享同一个份数据库与对象存储,实现强一致性保证的分布式文件系统,具有 POSIX 完全兼容、高性能等特性。
元数据管理对比:GlusterFS 元数据是纯分布式的,没有集中的元数据服务。客户端通过文件名哈希确定所属的 Brick,当请求需要跨多个 Bricks 访问时,由客户端负责协调。JuiceFS 的元数据存储在独立的数据库中,客户端将文件元数据操作转换成数据库事务,借助数据库的事务能力保证操作的原子性。
数据管理对比:GlusterFS 通过整合多个服务端节点的 Bricks 存储数据,提供一定的数据管理功能。JuiceFS 不直接使用硬盘,而是通过对接各种对象存储来管理数据,大部分特性依赖于对象存储自身的实现。
大文件拆分、冗余保护、数据压缩、数据加密、访问协议、POSIX 兼容性、NFS 协议、CIFS 协议、S3 协议、HDFS 兼容性、CSI 驱动、扩展功能、POSIX ACLs、跨域复制、目录配额、快照、回收站等都是分布式文件存储中常见的功能。
分布式存储 GlusterFS 介绍与部署
GlusterFS系统是一个具有高扩展性、高可用性、高性能、可横向扩展特性的可扩展网络文件系统。它设计上没有元数据服务器,确保服务没有单点故障。客户端访问文件时,通过挂载点读写数据,用户感知不到文件系统是本地还是远程。
GlusterFS提供了多种分布式存储方案。其中,分布式卷以哈希算法存储文件;复制卷将文件复制多份,建议每份存储在不同服务器上;条带卷将文件分条带存储;分布式条带卷将文件多分条带在多个节点上存储;分布式复制卷将文件在多个节点上哈希存储,并在多个服务器上复制多份;条带式复制卷将大文件划分为条带并保存多份。
部署GlusterFS环境时,日志存储集群采用分布式复制卷方式,以提高数据可靠性。五个服务器共享T磁盘空间,实际可用空间为T。分布式复制卷要求服务器数量为双数,因此每台服务器创建两个brick。管理节点用于协调集群操作,客户端通过NFS挂载集群。
安装GlusterFS后,创建集群,并对磁盘进行相应操作,如创建卷组、逻辑卷等,最终形成分布式复制卷模式。GlusterFS服务本身支持NFS挂载,但通过Nginx代理NFS实现多网段支持更为方便。NFS-Ganesha通过FSAL将存储抽象为统一API,支持指定NFS版本,实现客户端对存储空间的访问。
客户端可采用GlusterFS方式或NFS方式进行挂载,实现对存储资源的访问。阮一峰在GitHub的开源项目提供了更多相关技术文章,欢迎关注与讨论。
Gluster ç®ä»
Gluster æ¯ä¸ç§å¯æ©å±çåå¸å¼æ件系ç»ï¼å¯å°æ¥èªå¤ä¸ªæå¡å¨çç£çåå¨èµæºèåå°ä¸ä¸ªå ¨å±å½å空é´ä¸ã
GlusterFS ä½ç³»ç»æå°è®¡ç®ï¼åå¨å I/O èµæºèåå°ä¸ä¸ªå ¨å±å½å空é´ä¸ã æ¯å°æå¡å¨å ä¸åå¨è®¾å¤ï¼é 置为ç´è¿åå¨ï¼JBOD æ使ç¨åå¨åºåç½ç»ï¼è¢«è§ä¸ºèç¹ã éè¿æ·»å å ¶å®èç¹æåæ¯ä¸ªèç¹æ·»å é¢å¤åå¨æ¥æ©å±å®¹éã éè¿å¨æ´å¤èç¹ä¹é´é¨ç½²åå¨æ¥æé«æ§è½ã éè¿å¨èç¹ä¹é´å¤å¶æ°æ®æ¥å®ç°é«å¯ç¨æ§ã
GlusterFS éè¿ä»¥å¤ªç½æ Infiniband RDMA äºè¿å°åç§åå¨æå¡å¨èåå°ä¸ä¸ªå¤§å并è¡ç½ç»æ件系ç»ä¸ã GlusterFS åºäºå¯å å çç¨æ·ç©ºé´è®¾è®¡ã
GlusterFS æä¸ä¸ªå®¢æ·ç«¯åæå¡å¨ç»ä»¶ãæå¡å¨é常é¨ç½²ä¸º storage bricksï¼æ¯ä¸ªæå¡å¨è¿è¡ glusterfsd å®æ¤ç¨åºä»¥å°æ¬å°æ件系ç»å¯¼åºä¸º volumeã glusterfs 客æ·ç«¯è¿ç¨éè¿ TCP/IPï¼InfiniBand æå¥æ¥åç´æ¥åè®®è¿æ¥å°å ·æèªå®ä¹åè®®çæå¡å¨ï¼ä½¿ç¨å¯å å 转æ¢å¨ä»å¤ä¸ªè¿ç¨æå¡å¨å建å¤åèæå·ãé»è®¤æ åµä¸ï¼æ件æ¯æ´ä½åå¨çï¼ä½ä¹æ¯æè·¨å¤ä¸ªè¿ç¨å·åå²æ件ãç¶åï¼å®¢æ·ç«¯ä¸»æºå¯ä»¥éè¿ FUSE æºå¶ä½¿ç¨èªå·±çæ¬æºåè®®ï¼ä½¿ç¨å ç½®æå¡å¨è½¬æ¢å¨ç NFS v3 åè®®æéè¿ libgfapi 客æ·ç«¯åºè®¿é® volumeã
GlusterFS ç大å¤æ°åè½é½å®ç°ä¸ºè½¬æ¢å¨ï¼å æ¬åºäºæ件çéååå¤å¶ï¼åºäºæ件çæ¡å¸¦åï¼åºäºæ件çè´è½½åè¡¡ï¼å·æ é转移ï¼è°åº¦åç£çç¼åï¼åå¨é é¢ä»¥åå ·æç¨æ·å¯ç»´æ¤æ§çå·å¿«ç §ï¼èª GlusterFS 3.6 çæ¬ä»¥æ¥ )ã
GlusterFS æå¡å¨ææä¿æç®åï¼å®æåæ ·å¯¼åºç°æç®å½ï¼å°å ¶çç»å®¢æ·ç«¯è½¬æ¢å¨æ¥æ建åå¨ã客æ·ç«¯æ¬èº«æ¯æ ç¶æçï¼ä¸ç¸äºéä¿¡ï¼å¹¶ä¸ææå ·æå½¼æ¤ä¸è´ç转æ¢å¨é ç½®ã GlusterFS ä¾èµäºå¼¹æ§æ£åç®æ³(elastic hashing algorithm)ï¼èä¸æ¯ä½¿ç¨éä¸å¼æåå¸å¼å æ°æ®æ¨¡åãä½¿ç¨ GlusterFS 3.1 åæ´é«çæ¬ï¼å¯ä»¥å¨ææ·»å ï¼å é¤æè¿ç§»å·ï¼æå©äºé¿å é ç½®ä¸è´æ§é®é¢ï¼å¹¶å 许 GlusterFS éè¿é¿å é常ä¼å½±åæ´ç´§å¯è¦åçåå¸å¼æ件系ç»çç¶é¢ï¼å¨åç¨ç¡¬ä»¶ä¸æ©å±å°å PB ã
GlusterFS éè¿åç§å¤å¶é项æä¾æ°æ®å¯é æ§åå¯ç¨æ§ï¼å¤å¶å·åå°çå¤å¶ãå¤å¶å·ç¡®ä¿æ¯ä¸ªæ件è³å°åå¨ä¸ä¸ªå¯æ¬ï¼å æ¤å¦æä¸ä¸ªæ件åºç°æ éï¼ä»ç¶å¯ä»¥è®¿é®æ°æ®ãå°çå¤å¶æä¾äºä¸»ä»æ¨¡å¼çå¤å¶ï¼ volume ä¼è·¨ä¸åçå°çä½ç½®è¿è¡å¤å¶ãè¿æ¯å¼æ¥åççï¼å¨åçæ éæ¶å¤ä»½æ°æ®é常æç¨ã
https://docs.gluster.org/en/latest/Administrator%Guide/GlusterFS%Introduction/
https://en.wikipedia.org/wiki/Gluster
什么是分布式存储?
分布式存储简单的来说,就是将数据分散存储到多个存储服务器上,并将这些分散的存储资源构成一个虚拟的存储设备,实际上数据分散的存储在企业的各个角落。
还可以这样理解:
利用分布式技术将标准X服务器的本地HDD、SSD等存储介质组织成一个大规模存储资源池,同时,对上层的应用和虚拟机提供工业界标准的SCSI、iSCSI和对象访问接口,进而打造一个虚拟的分布式统一存储产品。
GlusterFSåCephåªä¸ªå¥½ï¼
GlusterFSåCephé½æ¯Red Hatæä¸çæççå¼æºåå¨äº§åï¼Cephä¸GlusterFSå¨åçä¸æçæ¬è´¨ä¸çä¸åãç°å¨ç½ä¸æå¾å¤GlusterFSåCephç对æ¯æç« ï¼å¯ä»¥åèãæ»çæ¥è¯´ï¼å¦æåªä½¿ç¨æ件åè®®ï¼æè§GlusterFS好ä¸äºï¼å¦æè¦ä½¿ç¨å¯¹è±¡ãåãæ件ç»ä¸åå¨ï¼é£Cephæ¯ä¸äºéæ©ãè¦ä½¿ç¨å¥½è¿ä¸¤ä¸ªå¼æºè½¯ä»¶ï¼é½éè¦æä¸å®çITå®ååæå ¥ï¼å¦æå®é ä¸ç产使ç¨ï¼å»ºè®®éæ©åä¸åç产åï¼GlusterFSåä¸äº§ååå¾æ¯è¾å¥½çå ¬å¸æ大éãå¯ç¿ï¼Cephåä¸äº§ååå¾æ¯è¾å¥½çå ¬å¸æXSKYãå æ ¸äºãæ岩ã