본문 바로가기
IT생활

RAID-Z1에서 디스크 하나가 고장 나면 어떻게 되는가?

by 우물 밖 개구리. 2025. 3. 15.
반응형

RAID-Z1에서 디스크 하나가 고장 나면 어떻게 되는가?

RAID-Z1은 단일 패리티(Parity) 보호를 제공하는 ZFS 기반 RAID 구성입니다. 즉, 디스크 1개가 고장 나더라도 데이터 액세스가 가능하지만, 추가 장애 발생 시 데이터 손실 위험이 커집니다.


1. RAID-Z1에서 디스크 1개 장애 시 동작 방식

디스크 1개 장애 발생 후에도 풀(Pool) 데이터에 접근 가능

  • RAID-Z1은 단일 패리티를 사용하여 하나의 디스크가 고장 나더라도 데이터 복구가 가능
  • TrueNAS는 남아 있는 디스크와 패리티 데이터를 이용하여 데이터를 계속 제공
  • 다만, 디스크 성능이 저하될 수 있으며, 즉시 디스크를 교체하여 복구해야 함

TrueNAS 웹 관리 페이지에서 나타나는 경고 메시지

  • 스토리지 → 풀(Pool) 상태에서 "DEGRADED(저하됨)" 상태로 표시됨
  • "1개의 디스크가 손실되었으며, 즉시 교체가 필요합니다" 같은 경고 메시지 표시
  • 풀 상태 확인 (zpool status 명령어로 확인 가능)

CLI에서 zpool status 명령어를 실행하면 다음과 같은 메시지 확인 가능

zpool status -v

출력 예시:

pool: tank
 state: DEGRADED
status: One or more devices has failed, but a single device failure is tolerated.
action: Replace the failed device with 'zpool replace'.
   see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-9P
config:

    NAME        STATE     READ WRITE CKSUM
    tank        DEGRADED     0     0     0
      raidz1-0  DEGRADED     0     0     0
        da0     ONLINE       0     0     0
        da1     ONLINE       0     0     0
        da2     FAULTED      0     0     0  (unrecoverable I/O errors)

errors: No known data errors

FAULTED(장애 발생) 상태가 표시된 디스크(da2)가 장애 발생한 디스크


2. RAID-Z1에서 디스크 1개 장애 후 시스템 동작 방식

 

상황  파일 액세스 가능 여부 풀 상태 (TrueNAS 웹 UI)   CLI zpool status 출력
정상 (Normal) ✅ 가능 ONLINE ONLINE
디스크 1개 장애 (RAID-Z1 내 허용 범위) ✅ 가능 (성능 저하 가능) DEGRADED (저하됨) DEGRADED
디스크 2개 장애 (RAID-Z1 허용 범위 초과, 데이터 손실) ❌ 불가능 FAULTED (실패, 풀 마운트 해제됨) FAULTED

즉, 디스크 1개 장애 시에도 데이터를 계속 사용할 수 있지만, RAID-Z1은 더 이상의 디스크 장애를 견딜 수 없기 때문에 즉시 디스크를 교체해야 함


3. RAID-Z1에서 장애 발생 후 디스크 교체 및 복구 방법

1️⃣ 고장난 디스크 식별 (zpool status 확인)

zpool status -v

➡ FAULTED 상태인 디스크 확인

2️⃣ 새로운 디스크 장착 및 교체 진행

  • 고장난 디스크를 물리적으로 제거 후, 새 디스크 연결
  • zpool replace 명령어 실행
zpool replace tank /dev/old-disk /dev/new-disk

예제:

zpool replace tank da2 da4

3️⃣ 재동기화 진행 (Resilvering)

TrueNAS는 자동으로 Resilvering(데이터 복구) 시작

  • 진행 상태 확인:
    zpool status
    
  • Resilvering은 디스크 크기와 데이터 양에 따라 몇 시간 ~ 하루 이상 걸릴 수 있음

4️⃣ 복구 완료 후 상태 확인

  • DEGRADED 상태가 ONLINE으로 변경되었는지 확인
  • 최종적으로 풀 상태가 정상적으로 ONLINE으로 복구되었는지 확인
zpool status

웹 UI에서도 "DEGRADED" → "ONLINE" 상태로 변경됨


4. RAID-Z1에서 디스크 2개 장애 발생 시 (데이터 복구 불가능)

RAID-Z1에서 디스크 2개 장애 시 풀(Pool)이 "FAULTED" 상태로 전환되며 데이터 복구 불가능

  • RAID-Z1은 패리티 1개만 존재하므로, 2개의 디스크 장애 발생 시 모든 데이터가 손실됨
  • TrueNAS 웹 UI에서 "FAULTED" 상태로 표시되며, 풀 자체가 마운트 해제될 수 있음

디스크 2개 이상 장애 시 복구 방법

  1. 백업이 있는 경우, RAID-Z2 또는 미러로 새 풀을 구성한 후 복원
  2. 백업이 없는 경우, 데이터 복구 전문 업체 의뢰 (비용이 높음)

RAID-Z1은 데이터 보호가 제한적이므로, 가능하면 RAID-Z2(2개의 패리티) 또는 백업을 함께 운영하는 것이 필수적


5. 결론: RAID-Z1에서 디스크 1개 장애 발생 시 주요 요약

 

질문  답변
RAID-Z1에서 디스크 1개가 죽으면 풀(Pool)은 어떻게 되는가? 풀은 DEGRADED(저하됨) 상태가 되며, 데이터 액세스는 가능하지만 성능이 저하될 수 있음.
TrueNAS 웹 UI에서 어떻게 표시되는가? 스토리지 → 풀에서 "DEGRADED" 경고 메시지 표시, "디스크 교체 필요" 알림 발생.
CLI에서 zpool status 출력 내용은? DEGRADED 상태이며, 장애 디스크는 FAULTED 상태로 표시됨.
디스크 1개 장애 시 어떻게 복구하는가? 새 디스크를 장착한 후 zpool replace로 교체하면 Resilvering(재동기화) 진행됨.
디스크 2개 장애 시 어떻게 되는가? RAID-Z1의 허용 한계를 초과하여 "FAULTED" 상태가 되며, 데이터 복구 불가능

➡ 해결책:

  1. 디스크 1개 장애 시, 즉시 교체하여 복구할 것!
  2. 가능하면 RAID-Z2(패리티 2개)로 업그레이드하여 안정성을 높일 것!
  3. 중요한 데이터는 RAID 구성과 별도로 주기적인 백업 필수!
반응형