《计算机组织结构》期末复习-第11讲-冗余磁盘阵列

第11讲-冗余磁盘阵列

冗余磁盘阵列/独立磁盘冗余阵列：Redundant Arrays of Independent Disks (RAID)
基本思想
- 将多个独立操作的磁盘按某种方式组织成磁盘阵列，以增加容量
- 将数据存储在多个盘体上，通过这些盘并行工作来提高数据传输率
- 采用数据冗余来进行错误恢复以提高系统可靠性
特性
- 由一组物理磁盘驱动器组成，被视为单个逻辑驱动器。
- 数据是分布在多个物理磁盘上，分布方案称为条带。
- 冗余磁盘容量用于存储奇偶校验信息，保证磁盘万一损坏时能恢复数据。

数据以条带的形式在可用的磁盘上分布
不采用冗余来改善性能（不是RAID 家族中的真正成员）
用途
- 高数据传输率
- 高速响应I/O 请求：两个I/O 请求所需要的数据块可能在不同的磁盘上.如果条的大小相对较大，那么单个IO请求只涉及单个磁盘访问，则多个等待的IO请求就可以被并行处理，减少了每个请求的排队时间。

采用了数据条带，采用简单地备份所有数据的方法来实现冗余。
优点
- 高速响应I/O 请求：即便是同一个磁盘上的数据块，也可以由两组硬盘分别响应。
- 读请求可以由包含请求数据的两个对应磁盘中的某一个提供服务，可以选择寻道时间较小的那个。
- 写请求需要更新两个对应的条带：可以并行完成，但受限于写入较慢的磁盘。
- 单个磁盘损坏时不会影响数据访问，恢复受损磁盘简单。
缺点
- 价格昂贵（一半的容量）。
用途
- 只限于用在存储系统软件、数据和其他关键文件的驱动器中
- 与RAID 0 相比
  - 如果有大批的读请求，则RAID 1 能实现高速的I/O 速率，性能可以达到RAID 0
    的两倍
  - 如果I/O 请求有相当大的部分是写请求，则它不比RAID 0 的性能好多少
RAID 01 vs. RAID 10
- RAID 01= RAID 0+1：先做RAID 0，再做RAID 1
- RAID 10= RAID 1+0：先做RAID 1，再做RAID 0
- 两者在数据传输率和磁盘利用率上没有明显区别，主要区别是对磁盘损坏的容错能力
- 若Disk 0 和Disk 1 坏掉
  - RAID 01：两个RAID 0均无法工作，整个体统无法工作。
  - RAID 10：两个RAID 1失去了校验功能，但仍可读写信息，系统可以正常工作。

与RAID 4 组织方式相似（常用）
在所有磁盘上都分布了奇偶校验条带
- 避免潜在的I/O 瓶颈问题
访问时的“两读两写”：读在写前，读写不需要并行
𝑃’(𝐵) = 𝑃(𝐵)⨁𝐵₀⨁ 𝐵’₀
RAID 50
- RAID 5 与RAID 0 的组合，先作RAID 5，再作RAID 0，也就是对多组RAID 5 彼此构成条带访问
- RAID 50 在底层的任一组或多组RAID 5 中出现1 颗硬盘损坏时，仍能维持运作；如果任一组RAID 5 中出现2 颗或2 颗以上硬盘损毁，整组RAID 50 就会失效
- RAID 50 由于在上层把多组RAID 5 进行条带化，性能比起单纯的RAID 5 高，但容量利用率比RAID 5 要低