百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

分布式文件存储|Ceph分布式存储基础

bigegpt 2025-01-11 10:31 24 浏览



简介

随着数据量的不断增加,传统的存储方式已经无法满足复杂应用场景下的存储需求。传统的存储类型一般包括本地磁盘、网络存储(NAS)和存储区域网络(SAN),这些存储方式面临着很多挑战。例如,本地磁盘存储容量有限,无法扩展;NAS和SAN存储成本高昂,并且难以扩展。

传统的存储类型

DAS设备:SAS、 SATA、 SCSI、 IDE、 USB

无论是哪种接口,都是存储设备驱动下的磁盘设备,而磁盘设备其实就是一种存储,这种存储是直接接入到主板总线上去的。

NAS设备:NFS、SIFS、FTP

几乎所有的网络存储设备基本上都是以文件系统样式进行使用,无法进一步格式化操作。

SAN:SCSI 协议、EC SAN、 iSCSI

基于SAN方式提供给客户端操作系统的是一种块设备接口,这些设备间主要通过SCSI协议来完成正常的通信。SCSI 的结构类似于TCPNIP协议,也有很多层,但是scsl 协议主要是用来进行存储数据操作的。既然是分层方式实现的,那就是说,有部分层可以被替代。比如将物理层基于EC方式来实现,就形成了ECSAN,如果基于以太网方式来传递数据,就形成了iSCSl模式。

传统的存储方式问题

  • 存储处理能力不足:传统的IDE的IO值是100次/秒,SATA固态磁盘500次/秒,NVMe固态硬盘达到2000-4000次/秒。即使磁盘的IO能力再大数十倍,难道能够抗住网站访问高峰期数十万、数百万甚至上亿用户的同时访问么?这同时还要受到主机网络IO能力的限制。
  • 存储空间能力不足:单块磁盘的容量再大,也无法满足用户的正常访问所需的数据容量限制。
  • 单点问题:单主机存储数据存在SPQE(single point of failure)问题

相比之下,分布式存储提供了更好的解决方案。它可以将数据存储在多个节点上,实现数据的高可用性和容错性。常见的分布式存储软件包括Ceph、Hadoop分布式文件系统、GlusterFS等。

Ceph是一个功能强大的分布式存储系统,它具有高可用性、容错性和可扩展性,适用于许多应用场景。作为一种先进的存储方式,分布式存储将在未来变得越来越流行,并成为企业数据存储的主流选择。

Ceph是一个自由的分布式存储系统,提供了对象、块和文件系统存储,并具有高可用性和容错性。Ceph有以下几个主要优势:

  • 可扩展性:Ceph的存储集群可以轻松地进行水平扩展,通过添加新节点来增加存储容量和性能。
  • 高可用性:Ceph使用冗余机制来确保数据的高可用性。当一个节点或硬盘出现故障时,Ceph会自动重复数据,保证数据不会丢失。
  • 容错性:Ceph使用一个称为CRUSH的算法来确保数据的冗余分布。当节点出现故障时,Ceph可以自动重新平衡数据的位置,以确保数据的容错性。
  • 易于管理:Ceph提供了丰富的管理工具来监控和管理存储集群,例如ceph-deploy、ceph-disk等。管理员可以使用这些工具轻松地进行集群的部署、维护和升级。
官方地址:https://ceph.com/en
官方文档:https://docs.ceph.com/en/latest/
GitHub地址:https://github.com/ceph/ceph

Ceph简介和特性

Ceph是一个多版本存储系统,它把每一个待管理的数据流(例如一个文件)切分为一到多个固定大小的对象数据,并以其为原子单元完成数据存取。

对象数据的底层存储服务是由多个主机(host)组成的存储集群,该集群也被称之为RADOS(Reliable Automatic Distributed Object Store)存储集群,即可靠、自动化、分布式对象存储系统。

librados是RADOS存储集群的API,它支持C、C++、Java、Python、Ruby和PHP等编程语言。

Ceph通过内部的crush机制,实时方式计算出一个文件应该存储到哪个存储对象里面,从而实现快速查找对象的一种方式。

为什么Ceph这么火?

功能强大:Ceph能够同时提供对象存储,块存储和文件系统存储三种存储服务的统一存储架构

可扩展性:Ceph得以摒弃了传统的集中式数据寻址方案,通过Crush算法的寻址操作,有相当强大的扩展性。

高可用性:Ceph数据副本数量可以由管理员自行定义,并可以通过Crush算法指定副本的物理存储位置以分隔故障域,支持数据强一致性的特性也使Ceph具有了高可靠性,可以忍受多种故障场景并自动尝试并行修复。

RadosGW、RDB和CephFS都是RADOS存储服务的客户端,它们把RADOS的存储服务接口(librados)分别从不同的角度做了进一步抽象,因而各自适用于不同的应用场景。

也就是说,Ceph将三种存储类型统一在一个平台中,从而实现了更强大的适用性。

librados - 通过自编程方式实现数据的存储能力
radosgw - 通过标准的RestFul接口,提供一种云存储服务
rbd - 将cept提供的空间,模拟成一个个的独立块设备。当ceph部署完成,服务端就准备好rbd接口
cfs - 通过一个标准的文件系统接口来进行数据的存储

Ceph组件

无论是想向平台提供Ceph对象存储和Ceph块设备服务、部署Ceph文件系统,或者是将Ceph用于其他目的,所有的Ceph存储集群部署都从设置每个Ceph节点网络开始。

一个Ceph存储集群至少需要一个Ceph Monitor、Ceph Manager和Ceph OSD(object storage daemon对象存储守护进程)。此外如果有运行Ceph文件系统的客户端,还需要配置Ceph元数据服务器。

Ceph网络模型

Ceph的网络模型是非常灵活和可扩展的,并且能够适应不同的应用场景。它允许用户自由选择不同的网络协议,以及对存储节点进行扩容和缩容等操作,从而实现更好的性能和可靠性。

Ceph采用CRUSH算法,实现数据划分及分布式的动态负载均衡。在Ceph的网络模型中,客户端通过Ceph的RADOS Gateway(RGW)或者Ceph FS接口访问Ceph集群中的对象存储和文件系统。而Ceph OSD Daemon则实际上负责管理和存储存储集群中的对象数据和元数据。

在Ceph网络模型中,客户端与存储集群之间的通信是通过Ceph提供的网络协议完成的。Ceph支持多种网络协议,包括TCP/IP、InfiniBand、RoCE等,这让用户可以根据不同的应用场景配置不同的网络协议以获得更好的性能和可靠性。

当客户端发起请求时,该请求会先被发送到Ceph Monitor进程,由它来管理集群的状态和负载,并将请求路由到适当的Ceph OSD Daemon上。Ceph OSD Daemon负责处理读写请求,将数据读取或写入存储设备中,并返回响应给客户端。

Ceph版本

每个Ceph版本都有一个英文名称和一个数字形式的版本编号。其中,英文名称是以字母顺序逐渐递增的方式命名的。以下是Ceph各个版本的英文名称及其数字形式的版本编号:

  1. Ceph v0.80 Firefly
  2. Ceph v0.87 Giant
  3. Ceph v0.89 Hammer
  4. Ceph v0.94 Infernalis
  5. Ceph v10.2 Jewel
  6. Ceph v10.2.3 Jewel Update 3
  7. Ceph v11.0 Kraken
  8. Ceph v12.0 Luminous
  9. Ceph v12.2 Luminous
  10. Ceph v13.0 Mimic
  11. Ceph v14.0 Nautilus
  12. Ceph v15.0 Octopus
  13. Ceph v16.0 Pacific
  14. Ceph v17.0 Quincy

数字形式的版本编号包括主版本号、次版本号和修订版本号。例如,Ceph v14.2中的14表示主版本号,2表示次版本号,而两者之间的小数点后面则是修订版本号。通常来说,主版本号表示Ceph的重大更新,次版本号表示增量更新,而修订版本号则表示缺陷修复或紧急补丁。

可以在这里看到Ceph的历史版本

https://docs.ceph.com/en/latest/releases/

Ceph集群部署方法介绍

在Ceph集群的部署中,有很多种不同的方式可以选择,下面对各种方式进行简要的特点分析:

  1. Cephadm:使用容器和systemd安装和管理Ceph集群,并与SL和仪表板GUI紧密集成,支持Octopus以后的新版本,是当前官方推荐的部署方式。
  2. ceph-deploy:一个基于Python实现流行的快速部署集群的工具,但从Nautilus版后不再支持和测试,不建议使用此工具安装Nautilus之前旧版本。
  3. Rook:在Kubernetes中运行的Ceph集群,同时还支持通过Kubernetes API管理存储资源和配置,只支持Nautilus以后的新版本,此工具不支持较新的OS。
  4. cephansible、ceph-salt、cephmon:使用Ansible、Salt等工具部署和管理Ceph集群,应用广泛,但从Nautilus和Octopus版开始没有集成对应的API,因此一些较新的管理功能和仪表板集成不可用。
  5. Puppet:通过Puppet进行Ceph集群的自动化部署,较为灵活,但需要一定的Puppet技能。
  6. 二进制:手动安装需要较高的技术水平和经验,但也较为灵活,能够更好地满足复杂的部署需求。
  7. Windows图形:在Windows主机上通过图形操作就可以进行Ceph集群的部署,适用于不熟悉命令行或Linux的用户。

不同的部署方式具有不同的特点和优缺点,在选择时需要根据实际情况进行权衡和考虑。

Ceph的集群环境规划和部署,后续文章再写,各位看官持续关注。

相关推荐

当Frida来“敲”门(frida是什么)

0x1渗透测试瓶颈目前,碰到越来越多的大客户都会将核心资产业务集中在统一的APP上,或者对自己比较重要的APP,如自己的主业务,办公APP进行加壳,流量加密,投入了很多精力在移动端的防护上。而现在挖...

服务端性能测试实战3-性能测试脚本开发

前言在前面的两篇文章中,我们分别介绍了性能测试的理论知识以及性能测试计划制定,本篇文章将重点介绍性能测试脚本开发。脚本开发将分为两个阶段:阶段一:了解各个接口的入参、出参,使用Python代码模拟前端...

Springboot整合Apache Ftpserver拓展功能及业务讲解(三)

今日分享每天分享技术实战干货,技术在于积累和收藏,希望可以帮助到您,同时也希望获得您的支持和关注。架构开源地址:https://gitee.com/msxyspringboot整合Ftpserver参...

Linux和Windows下:Python Crypto模块安装方式区别

一、Linux环境下:fromCrypto.SignatureimportPKCS1_v1_5如果导包报错:ImportError:Nomodulenamed'Crypt...

Python 3 加密简介(python des加密解密)

Python3的标准库中是没多少用来解决加密的,不过却有用于处理哈希的库。在这里我们会对其进行一个简单的介绍,但重点会放在两个第三方的软件包:PyCrypto和cryptography上,我...

怎样从零开始编译一个魔兽世界开源服务端Windows

第二章:编译和安装我是艾西,上期我们讲述到编译一个魔兽世界开源服务端环境准备,那么今天跟大家聊聊怎么编译和安装我们直接进入正题(上一章没有看到的小伙伴可以点我主页查看)编译服务端:在D盘新建一个文件夹...

附1-Conda部署安装及基本使用(conda安装教程)

Windows环境安装安装介质下载下载地址:https://www.anaconda.com/products/individual安装Anaconda安装时,选择自定义安装,选择自定义安装路径:配置...

如何配置全世界最小的 MySQL 服务器

配置全世界最小的MySQL服务器——如何在一块IntelEdison为控制板上安装一个MySQL服务器。介绍在我最近的一篇博文中,物联网,消息以及MySQL,我展示了如果Partic...

如何使用Github Action来自动化编译PolarDB-PG数据库

随着PolarDB在国产数据库领域荣膺桂冠并持续获得广泛认可,越来越多的学生和技术爱好者开始关注并涉足这款由阿里巴巴集团倾力打造且性能卓越的关系型云原生数据库。有很多同学想要上手尝试,却卡在了编译数据...

面向NDK开发者的Android 7.0变更(ndk android.mk)

订阅Google官方微信公众号:谷歌开发者。与谷歌一起创造未来!受Android平台其他改进的影响,为了方便加载本机代码,AndroidM和N中的动态链接器对编写整洁且跨平台兼容的本机...

信创改造--人大金仓(Kingbase)数据库安装、备份恢复的问题纪要

问题一:在安装KingbaseES时,安装用户对于安装路径需有“读”、“写”、“执行”的权限。在Linux系统中,需要以非root用户执行安装程序,且该用户要有标准的home目录,您可...

OpenSSH 安全漏洞,修补操作一手掌握

1.漏洞概述近日,国家信息安全漏洞库(CNNVD)收到关于OpenSSH安全漏洞(CNNVD-202407-017、CVE-2024-6387)情况的报送。攻击者可以利用该漏洞在无需认证的情况下,通...

Linux:lsof命令详解(linux lsof命令详解)

介绍欢迎来到这篇博客。在这篇博客中,我们将学习Unix/Linux系统上的lsof命令行工具。命令行工具是您使用CLI(命令行界面)而不是GUI(图形用户界面)运行的程序或工具。lsoflsof代表&...

幻隐说固态第一期:固态硬盘接口类别

前排声明所有信息来源于网络收集,如有错误请评论区指出更正。废话不多说,目前固态硬盘接口按速度由慢到快分有这几类:SATA、mSATA、SATAExpress、PCI-E、m.2、u.2。下面我们来...

新品轰炸 影驰SSD多款产品登Computex

分享泡泡网SSD固态硬盘频道6月6日台北电脑展作为全球第二、亚洲最大的3C/IT产业链专业展,吸引了众多IT厂商和全球各地媒体的热烈关注,全球存储新势力—影驰,也积极参与其中,为广大玩家朋友带来了...