首页天道酬勤raid1,raid0

raid1,raid0

张世龙 05-13 11:37 41次浏览

另一方面,raid (独立磁盘冗馀阵列,通常简称为磁盘阵列)。 简而言之,RAID是一个由多个独立、高性能磁盘驱动器组成的磁盘子系统,是一种提供比单个磁盘更高的存储性能和数据冗馀的技术。

二、关键概念和技术1、镜像(Mirroring ) :镜像是一种冗馀技术,为磁盘提供保护功能,防止磁盘故障导致的数据丢失。 对于RAID,镜像技术通常会在阵列中同时生成分布在两个不同磁盘驱动器组中的两个完全相同的数据的副本。 镜像提供了完整的数据冗馀,即使禁用了一个数据拷贝,外部系统也可以成功访问另一个拷贝,而不影响APP应用程序系统的行为和性能。 另外,镜像不需要额外的计算和检查,故障修复非常快,直接复制即可。 镜像技术可以同时从多个副本读取数据,从而提高读取I/O性能,但不能同时写入数据。 写入多个拷贝会降低一定的I/O性能。

镜像技术提供非常高的数据安全性,成本也非常高,至少需要两倍的存储容量。 高成本限制了镜像的广泛应用,主要应用于关键数据保护。 在这种情况下,数据丢失会带来很大的损失。 此外,在镜像中,“剥离”可以捕获特定时间点的数据快照,从而实现备份窗口几乎为零的数据备份技术。

2、数据条带化磁盘存储的性能瓶颈是磁头寻道位置,是低速机械运动,与高速CPU不匹配。 另外,单个磁盘驱动器的性能存在物理限制,I/O性能非常有限。 RAID由多个磁盘组成,数据条带化技术将数据以块为单位分散存储在多个磁盘上,并同时处理数据。 这样可以同时在多个磁盘上写入和读取数据,同时生成非常高的聚合I/O,有效提高总体I/O性能,具有良好的线性可扩展性。 这对于大容量数据尤为明显,如果不划分块,数据将按顺序存储在磁盘阵列的磁盘上,并在需要时按顺序读取。 条带化技术提供了比顺序访问快数倍的性能提升。

数据条带技术的块大小选择非常重要。 条带大小从1字节到几千字节,块大小越小,并行处理能力越高,数据访问速度越快,但块访问的随机性和块寻址时间越长。 在实际的APP应用中,需要根据数据的特点和需求选择适当的块大小,以平衡数据访问的随机性和并发处理能力,并实现尽可能高的整体性能。

数据条带是基于提高的I/O性能而提出的。 这意味着我们只关注性能,而不是提高数据的可靠性和可用性。 实际上,如果其中一个条带损坏,整个数据就不可用了,而条带技术会增加数据丢失的概念率。

3、数据验证(Data parity )镜像具有高安全性、高读取性能,但冗馀开销过高。 数据条带通过并发性大大提高了性能,但没有考虑数据的安全性和可靠性。 数据检测是一种多馀的技术,可以用检测数据提供数据安全,检测数据错误,并在能力允许的情况下进行数据重构。 对于镜像,数据验证大大减少了冗馀开销,以更低的成本实现了更好的数据完整性和可靠性。 数据条带技术提供高性能,数据验证提供数据安全性,并且在不同的RAID级别通常同时使用这两种技术。

进行数据验证时,RAID在数据写入的同时进行验证计算,并将得到的验证数据存储在RAID成员磁盘中。 验证数据可以存储在一个磁盘上,也可以分布在多个不同的磁盘上。 它还可以阻止验证数据,并且实现因RAID级别而异。 其中部分数据错误时,可以对剩下的数据和检测数据进行逆检测计算,重构丢失的数据。 验证技术相对于镜像技术的优点是节省了大量的开销,但由于每次读写数据都要进行大量的验证运算,因此要求计算机的运算速度,需要使用硬件RAID控制器。 在数据重建恢复方面,检查技术远比镜像技术复杂和慢。

汉明校验码和异或检验是两种最常用的数据检验算法。 汉明码由dbdppx提交,不仅可以检测错误,还可以给出错误的位置并自动纠正。 汉明检验的基本思想是将有效信息按照一定规律分成几组,对每组进行奇偶校验,放置奇偶校验位,从而可以提供多位检错信息来识别和纠正错误点。 可见汉明检验实质上是多重奇偶校验。 “异或”检查通过“异或”运算生成,进行有效信息和规定初始值的“异或”运算即可得到检查信息。 如果有效信息有错误,则可以通过验证信息和初始值的异或运算来恢复正确的有效信息。

三、典型的RAID类型1、RAID 0是将连续的数据分布在多个磁盘上进行访问,系统在有数据请求的情况下可以在多个磁盘上并行执行,每个磁盘执行自己的部分数据请求。 要创建RAID 0,一个服务至少需要两个硬盘,读写速度是一个硬盘的两倍。 如果有n个硬盘,读写速度将是一个硬盘的n倍。 读取/写入速度会提高,但由于没有数据备份功能,安全性会大幅降低。

好处:

)充分利用I/O总线的性能,使带宽翻倍,读写速度翻倍。

)2)充分利用磁盘空间,使利用率达到100%。

缺点:

)1)不提供数据冗馀。

)2)没有数据验证,不能保证数据的准确性。

)3)存在单点故障。

应用场景:

)1)对数据完整性要求不高的场景,如日志存储、个人娱乐等

)2)像图像工作站一样,要求读写效率高,安全性能不高

2、RAID 1通过磁盘数据镜像实现数据冗馀,位于成对的独立磁盘上

产生互为备份的数据。当原始数据繁忙时,可直接从镜像拷贝中读取数据。同样地,要做RAID1也是至少需要两块硬盘,单读取数据时,一块会被读取,一块会被用作备份数据。其数据安全性就会较高,但是磁盘空间利用率是比较低的。

优点:
(1)提供数据冗余,数据双倍存储。
(2)提供良好的读性能

缺点:
(1)无数据校验
(2)磁盘利用率低,成本高

应用场景:
存放重要数据,如数据存储领域

3、RAID2

RAID2称为纠错海明码磁盘阵列,其设计思想是利用海明码实现数据校验冗余。海明码是一种在原始数据中加入若干校验码来进行错误检测和纠正的编码技术,其中第 2n 位( 1, 2, 4, 8, … )是校验码,其他位置是数据码。因此在 RAID2 中,数据按位存储,每块磁盘存储一位数据编码,磁盘数量取决于所设定的数据存储宽度,可由用户设定。图中所示的为数据宽度为 4 的 RAID2 ,它需要 4 块数据磁盘和 3 块校验磁盘。如果是 64 位数据宽度,则需要 64 块 数据磁盘和 7 块校验磁盘。可见, RAID2 的数据宽度越大,存储空间利用率越高,但同时需要的磁盘数量也越多。
   海明码自身具备纠错能力,因此 RAID2 可以在数据发生错误的情况下对纠正错误,保证数据的安全性。它的数据传输性能相当高,设计复杂性要低于后面介绍的 RAID3 、 RAID4 和 RAID5 。
但是,海明码的数据冗余开销太大,而且 RAID2 的数据输出性能受阵列中最慢磁盘驱动器的限制。再者,海明码是按位运算, RAID2 数据重建非常耗时。由于这些显著的缺陷,再加上大部分磁盘驱动器本身都具备了纠错功能,因此 RAID2 在实际中很少应用,没有形成商业产品,目前主流存储磁盘阵列均不提供 RAID2 支持。

优点:
(1)有数据校验机制
(2)磁盘的寻道时间减少

缺点:
(1)目前应用场景不多,基本被淘汰。
(2)成本高

应用场景:
影像处理或者CAD/CAM的工作站

4、RAID3

RAID3是使用专用校验盘的并行访问阵列,它采用一个专用的磁盘作为校验盘,其余磁盘作为数据盘,数据按位和字节的方式交叉存储到各个数据盘中。RAID3至少需要三块磁盘,不同磁盘上同一带区的数据作 XOR 校验,校验值写入校验盘中。RAID3完好时读性能与 RAID0 完全一致,并行从多个磁盘条带读取数据,性能非常高,同时还提供了数据容错能力。向 RAID3 写入数据时,必须计算与所有同条带的校验值,并将新校验值写入校验盘中。一次写操作包含了写数据块、读取同条带的数据块、计算校验值、写入校验值等多个操作,系统开销非常大,性能较低。

如果 RAID3 中某一磁盘出现故障,不会影响数据读取,可以借助校验数据和其他完好数据来重建数据。假如所要读取的数据块正好位于失效磁盘,则系统需要读取所有同一条带的数据块,并根据校验值重建丢失的数据,系统性能将受到影响。当故障磁盘被更换后,系统按相同的方式重建故障盘中的数据至新磁盘。

采用Bit-interleaving(数据交错存储)技术,它需要通过编码再将数据位分区后分别存在硬盘中,而将同位检查后单独存在一个硬盘中,但由于数据内的位分散在不同的硬盘上,因此就算要读取一小段数据资料都可能需要所有的硬盘进行工作,所以这种规格比较适于读取大量数据时使用。

RAID3 只需要一个校验盘,阵列的存储空间利用率高,再加上并行访问的特征,能够为高带宽的大量读写提供高性能,适用大容量数据的顺序访问应用,如影像处理、流媒体服务等。目前, RAID5 算法不断改进,在大数据量读取时能够模拟 RAID3 ,而且 RAID3 在出现坏盘时性能会大幅下降,因此常使用 RAID5 替代 RAID3 来运行具有持续性、高带宽、大量读写特征的应用。


优点:
(1)有数据校验机制

缺点:
(1)校验盘很容易成为整个系统的瓶颈

应用场景:
(1)写操作较少,读操作较多的应用环境,如:数据库、WEB服务器等。
(2)适合大文件类型且安全性要求较高的应用,如视频编辑、硬盘播出机、大型数据库等。

5、RAID4

RAID4与RAID3的原理大致相同,区别在于条带化的方式不同。 RAID4按照 块的方式来组织数据,写操作只涉及当前数据盘和校验盘两个盘,多个 I/O 请求可以同时得到处理,提高了系统性能。 RAID4 按块存储可以保证单块的完整性,可以避免受到其他磁盘上同条带产生的不利影响。

RAID4在不同磁盘上的同级数据块同样使用 XOR 校验,结果存储在校验盘中。写入数据时, RAID4 按这种方式把各磁盘上的同级数据的校验值写入校验 盘,读取时进行即时校验。因此,当某块磁盘的数据块损坏, RAID4 可以通过校验值以及其他磁盘上的同级数据块进行数据重建。
  
RAID4提供了非常好的读性能,但单一的校验盘往往成为系统性能的瓶颈。对于写操作, RAID4 只能一个磁盘一个磁盘地写,并且还要写入校验数据,因此写性能比较差。而且随着成员磁盘数量的增加,校验盘的系统瓶颈将更加突出。正是如上这些限制和不足, RAID4 在实际应用中很少见,主流存储产品也很少使用 RAID4 保护。

优点:
(1)按块存储可以保证块的完整
(2)有校验机制

缺点:
(1)写效率差,每次写入需要生成校验
(2)硬盘损耗高

应用场景:
对数据安全性能高的环境,同RAID3

6、RAID5

RAID5应该是目前最常见的 RAID 等级,它的原理与 RAID4 相似,区别在于校验数据分布在阵列中的所有磁盘上,而没有采用专门的校验磁盘。对于数据和校验数据,它们的写操作可以同时发生在完全不同的磁盘上。因此, RAID5 不存在 RAID4 中的并发写操作时的校验盘性能瓶颈问题。另外, RAID5 还具备很好的扩展性。当阵列磁盘 数量增加时,并行操作量的能力也随之增长,可比 RAID4 支持更多的磁盘,从而拥有更高的容量以及更高的性能。

RAID5的磁盘上同时存储数据和校验数据,数据块和对应的校验信息存保存在不同的磁盘上,当一个数据盘损坏时,系统可以根据同一条带的其他数据块和对应的校验数据来重建损坏的数据。与其他 RAID 等级一样,重建数据时, RAID5 的性能会受到较大的影响。
  
RAID5 兼顾存储性能、数据安全和存储成本等各方面因素,它可以理解为 RAID0 和 RAID1 的折中方案,是目前综合性能最佳的数据保护解决方案。 RAID5 基本上可以满足大部分的存储应用需求,数据中心大多采用它作为应用数据的保护方案。

优点:
(1)读写性能高
(2)有校验机制
(3)磁盘空间利用率高

缺点:
(1)磁盘越多安全性能越差

应用场景:
安全性高,如金融、数据库、存储等。

7、RAID6

前面所述的各个 RAID 等级都只能保护因单个磁盘失效而造成的数据丢失。如果两个磁盘同时发生故障,数据将无法恢复。RAID6引入双重校验的概念,它可以保护阵列中同时出现两个磁盘失效时,阵列仍能够继续工作,不会发生数据丢失。 RAID6 等级是在 RAID5 的基础上为了进一步增强数据保护而设计的一种 RAID 方式,它可以看作是一种扩展的 RAID5 等级。

RAID6 不仅要支持数据的恢复,还要支持校验数据的恢复,因此实现代价很高,控制器的设计也比其他等级更复杂、更昂贵。 RAID6 思想最常见的实现方式是采用两个独立的校验算法,假设称为 P 和 Q ,校验数据可以分别存储在两个不同的校验盘上,或者分散存储在所有成员磁盘中。当两个磁盘同时失效时,即可通过求解两元方程来重建两个磁盘上的数据。
  
RAID6 具有快速的读取性能、更高的容错能力。但是,它的成本要高于 RAID5 许多,写性能也较差,并有设计和实施非常复杂。因此, RAID6 很少得到实际应用,主要用于对数据安全等级要求非常高的场合。它一般是替代 RAID10 方案的经济性选择。


优点:
(1)良好的随机读性能
(2)有校验机制

缺点:
(1)写入速度差
(2)成本高

应用场景:
对数据安全级别要求比较高的企业

四、RAID组合等级 1.RAID00

RAID00 是由多个成员 RAID0 组成的高级 RAID0 。它与 RAID0 的区别在于,RAID0 阵列替换了原先的成员磁盘。可以把 RAID00 理解为两层条带化结构的磁盘阵列,即对条带再进行条带化。这种阵列可以提供更大的存储容量、更高的 I/O 性能和更好的 I/O 负均衡。

2. RAID01

RAID01 是先做条带化再作镜像,本质是对物理磁盘实现镜像;而 RAID10 是先做镜像再作条带化,是对虚拟磁盘实现镜像。相同的配置下,通常 RAID01 比 RAID10 具有更好的容错能力。
RAID01 的数据将同时写入到两个磁盘阵列中,如果其中一个阵列损坏,仍可继续工作,保证数据安全性的同时又提高了性能。 RAID01 和 RAID10 内部都含有 RAID1 模式,因此整体磁盘利用率均仅为 50% 。

优点:
(1)较高的IO性能
(2)有数据冗余
(3)无单点故障

缺点:
(1)成本稍高
(2)安全性比RAID 10 差

应用场景:
特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如银行、金融、商业超市、仓储库房、各种档案管理等。

3、RAID10 是先做镜像再作条带化


优点:
(1)RAID10的读性能将优于RAID01
(2)较高的IO性能
(3)有数据冗余
(4)无单点故障
(5)安全性能高

缺点:
(1)成本稍高

应用场景:
特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如银行、金融、商业超市、仓储库房、各种档案管理等。

4、RAID100

通常看作 RAID 1+0+0 ,有时也称为 RAID 10+0 ,即条带化的 RAID10 。RAID100 的缺陷与 RAID10 相同,任意一个 RAID1 损坏一个磁盘不会发生数据丢失,但是剩下的磁盘存在单点故障的危险。最顶层的 RAID0 ,即条带化任务,通常由软件层来完成。

RAID100 突破了单个 RAID 控制器对物理磁盘数量的限制,可以获得更高的 I/O 负载均衡, I/O 压力分散到更多的磁盘上,进一步提高随机读性能,并有效降低热点盘故障风险。因此, RAID100 通常是大数据库的最佳选择。

5、RAID50

它具有RAID 5和RAID 0的共同特性。它由两组RAID 5磁盘组成(每组最少3个),每一组都使用了分布式奇偶位,而两组硬盘再组建成RAID 0,实现跨磁盘抽取数据。RAID 50提供可靠的数据存储和优秀的整体性能,并支持更大的卷尺寸。即使两个物理磁盘发生故障(每个阵列中一个),数据也可以顺利恢复过来。RAID 50最少需要6个驱动器,它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序。

inlove,阻抗分析仪测量原理 raid卡作用,webbios做raid5