반응형
RAID-Z1에서 디스크 하나가 고장 나면 어떻게 되는가?
RAID-Z1은 단일 패리티(Parity) 보호를 제공하는 ZFS 기반 RAID 구성입니다. 즉, 디스크 1개가 고장 나더라도 데이터 액세스가 가능하지만, 추가 장애 발생 시 데이터 손실 위험이 커집니다.
1. RAID-Z1에서 디스크 1개 장애 시 동작 방식
✅ 디스크 1개 장애 발생 후에도 풀(Pool) 데이터에 접근 가능
- RAID-Z1은 단일 패리티를 사용하여 하나의 디스크가 고장 나더라도 데이터 복구가 가능
- TrueNAS는 남아 있는 디스크와 패리티 데이터를 이용하여 데이터를 계속 제공
- 다만, 디스크 성능이 저하될 수 있으며, 즉시 디스크를 교체하여 복구해야 함
✅ TrueNAS 웹 관리 페이지에서 나타나는 경고 메시지
- 스토리지 → 풀(Pool) 상태에서 "DEGRADED(저하됨)" 상태로 표시됨
- "1개의 디스크가 손실되었으며, 즉시 교체가 필요합니다" 같은 경고 메시지 표시
- 풀 상태 확인 (zpool status 명령어로 확인 가능)
✅ CLI에서 zpool status 명령어를 실행하면 다음과 같은 메시지 확인 가능
zpool status -v
출력 예시:
pool: tank
state: DEGRADED
status: One or more devices has failed, but a single device failure is tolerated.
action: Replace the failed device with 'zpool replace'.
see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-9P
config:
NAME STATE READ WRITE CKSUM
tank DEGRADED 0 0 0
raidz1-0 DEGRADED 0 0 0
da0 ONLINE 0 0 0
da1 ONLINE 0 0 0
da2 FAULTED 0 0 0 (unrecoverable I/O errors)
errors: No known data errors
➡ FAULTED(장애 발생) 상태가 표시된 디스크(da2)가 장애 발생한 디스크
2. RAID-Z1에서 디스크 1개 장애 후 시스템 동작 방식
상황 | 파일 액세스 가능 여부 | 풀 상태 (TrueNAS 웹 UI) | CLI zpool status 출력 |
정상 (Normal) | ✅ 가능 | ONLINE | ONLINE |
디스크 1개 장애 (RAID-Z1 내 허용 범위) | ✅ 가능 (성능 저하 가능) | DEGRADED (저하됨) | DEGRADED |
디스크 2개 장애 (RAID-Z1 허용 범위 초과, 데이터 손실) | ❌ 불가능 | FAULTED (실패, 풀 마운트 해제됨) | FAULTED |
✅ 즉, 디스크 1개 장애 시에도 데이터를 계속 사용할 수 있지만, RAID-Z1은 더 이상의 디스크 장애를 견딜 수 없기 때문에 즉시 디스크를 교체해야 함
3. RAID-Z1에서 장애 발생 후 디스크 교체 및 복구 방법
1️⃣ 고장난 디스크 식별 (zpool status 확인)
zpool status -v
➡ FAULTED 상태인 디스크 확인
2️⃣ 새로운 디스크 장착 및 교체 진행
- 고장난 디스크를 물리적으로 제거 후, 새 디스크 연결
- zpool replace 명령어 실행
zpool replace tank /dev/old-disk /dev/new-disk
예제:
zpool replace tank da2 da4
3️⃣ 재동기화 진행 (Resilvering)
✅ TrueNAS는 자동으로 Resilvering(데이터 복구) 시작
- 진행 상태 확인:
zpool status
- Resilvering은 디스크 크기와 데이터 양에 따라 몇 시간 ~ 하루 이상 걸릴 수 있음
4️⃣ 복구 완료 후 상태 확인
- DEGRADED 상태가 ONLINE으로 변경되었는지 확인
- 최종적으로 풀 상태가 정상적으로 ONLINE으로 복구되었는지 확인
zpool status
✅ 웹 UI에서도 "DEGRADED" → "ONLINE" 상태로 변경됨
4. RAID-Z1에서 디스크 2개 장애 발생 시 (데이터 복구 불가능)
✅ RAID-Z1에서 디스크 2개 장애 시 풀(Pool)이 "FAULTED" 상태로 전환되며 데이터 복구 불가능
- RAID-Z1은 패리티 1개만 존재하므로, 2개의 디스크 장애 발생 시 모든 데이터가 손실됨
- TrueNAS 웹 UI에서 "FAULTED" 상태로 표시되며, 풀 자체가 마운트 해제될 수 있음
✅ 디스크 2개 이상 장애 시 복구 방법
- 백업이 있는 경우, RAID-Z2 또는 미러로 새 풀을 구성한 후 복원
- 백업이 없는 경우, 데이터 복구 전문 업체 의뢰 (비용이 높음)
➡ RAID-Z1은 데이터 보호가 제한적이므로, 가능하면 RAID-Z2(2개의 패리티) 또는 백업을 함께 운영하는 것이 필수적
5. 결론: RAID-Z1에서 디스크 1개 장애 발생 시 주요 요약
질문 | 답변 |
RAID-Z1에서 디스크 1개가 죽으면 풀(Pool)은 어떻게 되는가? | 풀은 DEGRADED(저하됨) 상태가 되며, 데이터 액세스는 가능하지만 성능이 저하될 수 있음. |
TrueNAS 웹 UI에서 어떻게 표시되는가? | 스토리지 → 풀에서 "DEGRADED" 경고 메시지 표시, "디스크 교체 필요" 알림 발생. |
CLI에서 zpool status 출력 내용은? | DEGRADED 상태이며, 장애 디스크는 FAULTED 상태로 표시됨. |
디스크 1개 장애 시 어떻게 복구하는가? | 새 디스크를 장착한 후 zpool replace로 교체하면 Resilvering(재동기화) 진행됨. |
디스크 2개 장애 시 어떻게 되는가? | RAID-Z1의 허용 한계를 초과하여 "FAULTED" 상태가 되며, 데이터 복구 불가능 |
➡ 해결책:
- 디스크 1개 장애 시, 즉시 교체하여 복구할 것!
- 가능하면 RAID-Z2(패리티 2개)로 업그레이드하여 안정성을 높일 것!
- 중요한 데이터는 RAID 구성과 별도로 주기적인 백업 필수!
반응형
'IT생활' 카테고리의 다른 글
RAID-Z1에서 디스크 고장 후, 여분 디스크가 없을 때 온라인 상태를 유지하는 것이 좋을까? (0) | 2025.03.15 |
---|---|
RAID-Z1에서 디스크 고장 시 시스템을 자동으로 종료하거나 오프라인으로 만드는 로직이 있는가? (0) | 2025.03.15 |
RAID-Z1에서 RAID-Z2로 변경하는 방법 (데이터 보호 유지) (0) | 2025.03.15 |
TrueNAS SCALE에서 적합한 분석 AI 시스템 (0) | 2025.03.15 |
NAS에 저장된 사진, 음성 분석 및 정리 시스템 (0) | 2025.03.15 |