네트워크 이중화 설정 아시는분 도움 부탁드립니다
L4 를 이중화해서 마스터-백업으로 나뉘어져있습니다.
간략한 구성은 이렇습니다. 클라이언트 - 라우터 - L4 - 서버
마스터 -백업 중 마스터 장비에서 포트를 끊어 마스터 - 백업 전환을 이루고자 했는데 클라이언트에서 서비스 IP로 요청시 끊김이 5-7초 정도 걸립니다.
그런데 순단적으로 통신이 지속적으로 되고있어야 한다고 하네요.
검색해보니 네트워크에선 5-7초 정도도 순단이라고 하던데 맞나요?
아니면 1초도 안걸리는 짧은 시간이 맞는건가요?
안녕하세요.
말씀하신 L4 기반 마스터–백업 이중화 환경이라면, 5~7초 순단은 일반적인 상황에서는 조금 긴 편입니다. 실제 현업에서 "순단이 없다" 혹은 "무중단 전환"이라고 말할 때 기준은 보통 1초 이내 혹은 수백 ms 단위로 끊김이 거의 느껴지지 않는 수준을 말합니다.
1. 5~7초 순단의 원인 가능성
가. ARP 갱신 지연 – VIP(가상 IP)가 백업 장비로 넘어갈 때, 클라이언트나 상위 라우터에 ARP 캐시가 남아 있으면 새 장비로 트래픽이 가지 않아 지연이 발생합니다.
나. L4 장비의 헬스체크 주기 – 헬스체크(Heartbeat) 주기가 3초 이상이면 마스터 다운을 인식하는 데 자체적으로 몇 초가 걸립니다.
다. VRRP/FHRP 설정 문제 – VRRP(HRSP, Keepalived 등) 전환 시 advert interval이나 preempt delay 값이 길게 설정되어 있으면 페일오버가 느립니다.
2. 정상적인 전환 시간 기준
잘 구성된 VRRP나 L4 HA 환경에서는 0.5초~1초 이내가 일반적입니다.
일부 고가 장비(F5, A10, Radware 등)는 200~500ms 수준으로 페일오버를 지원합니다.
따라서 5초 이상 걸린다면 ‘순단 없는 이중화’라고 보기 어렵습니다.
3. 개선 방법
가. Heartbeat 주기 단축 – 예: VRRP의 advert interval을 1초 → 0.5초 이하로 조정.
나. ARP 갱신 스크립트 추가 – 전환 시 arping 등을 통해 상위 장비 캐시 갱신.
다. Link down detection 사용 – 포트 끊김 시 즉시 장애로 감지하도록 설정.
라. L4 세션 동기화(Session sync) – 세션이 마스터와 백업에 실시간 복제되면 전환 시 재접속이 거의 발생하지 않습니다.
즉, 네트워크에서 ‘순단이 없다’는 말은 1초 이내 전환을 의미합니다.
현재처럼 5~7초 걸린다면 헬스체크 주기나 ARP 갱신 쪽 설정을 확인해 보세요.
실무적으로는 ARP 캐시 + VRRP 타이머 튜닝만으로도 1초 미만까지 줄일 수 있습니다.