Windows ETC

Cluster HeartBeat

2012.09.07 22:35

호스트웨이 조회 수:9541

클러스터 노드들은 Heartbeat 신호를 이용해서 노드의 OS레벨과 SQL 서버 레벨에서 살아있는지 확인한다.

SQL 서버 리소스를 호스팅하는 노드는 Service Control Manager 이용해서 5초마다 SQL 서버 서비스가 실행중인지 확인한다. "LooksAlive"확인은 성능에 영향을 주지 않는다. Running이면 성공이고 아니여도 운영상 문제는 없다. 보다 정확한 확인은 60초마다 수행되는 "IsAlive".

 

IsAlive:

  • 60초마다 실행
  • SQL 서버라면 @@SERVERNAME 구문을 이용해서 확인한다.
  • 모든 사용자 데이타베이스가 살아있는지 또는 요구되는 응답시간내에 수행되고 있는지를 보장하지 않는다.

 

IsAlive 확인 실패:

5 시도하고 SQL 서버 인스턴스에 다시 연결 시도흘 한다.

5 시도가 실패하면 서버 리소스는 fail 된다.

Failover threshold 설정 값에 따라 다르지만 failover Cluster 같은 노드에 있는 리소스를 모두 시작하거나 다른 가능한 노드로 failover 할것이다.

 

IsAlive 쿼리는 몇 개의 에러는 무시하지만 threshold 값을 초과하여 실패하면 fail이다.

 

SQL 서버 인스턴스가 failover되는 동안에 새로운 노드에서 SQL 서버 리소스가 시작되고 SQL 서버는 데이타베이스를 시작하기위해서 복구 프로세스를 진행한다. 서비스가 시작 후에는 master 데이타베이스가 살고, SQL 서버 리소스는 실행될 고려된다. 사용자 데이타베이스는 일반복구 프로세스가 진행된다. 트렌젝션 로그에 있는 완료된 트렌젝션은 롤퍼워드(rolled forward 또는 redo phase) 된다. 완료되지 않은 트렌젝션은 롤벡(rolled back 또는 undo phase)된다.

 

 

http://blogs.technet.com/b/rob/archive/2008/05/07/failover-clustering.aspx

SQL server enterprise에서는 각각의 사용자 데이타베이스는 사용 가능하다. 다른 에디션에서는(모든 SQL 2000 에디션 포함) 각각의 사용자 데이타베이스에 대해서 Undo Phase 완료 때까지 사용할 없다. 복구 프로세스의 처리 시간은 얼마나 많은 롤백이나 롤퍼워드같은 액티빅티가 필요하냐에 따라 다르다.

 

sp_configure 옵션의 "Recovery interval"은 복구 프로세스를 빠르게 하고 Redo recovery 시간이 길어지는 걸 방지하기 위해 낮은 값으로 설정된다. Undo recovery 시간은 트랜잭션을 짧게 처리함으로써 시간을 단축할 수 있다. 그래서 롤백되는데 커밋되지 않은 트랜잭션은 많지않다.

번호 제목 글쓴이 날짜 조회 수
97 Wbadmin delete catalog 호스트웨이 2012.06.23 11035
96 [Sharepoint - Case 9] 효율적인 블로그 file 호스트웨이 2012.05.04 10987
95 개체 엑세스 감사 file 호스트웨이 2012.05.11 10986
94 FSMO(Flexible Single Master Operation) 역할 이전 호스트웨이 2012.04.20 10966
93 DHCP의 백업 및 복원 호스트웨이 2012.06.11 10920
92 AD Database 저장위치를 다른 폴더 또는 디스크로 변경 호스트웨이 2012.10.26 10837
91 엔터프라이즈 위키 file 호스트웨이 2012.03.30 10685
90 HTTP 오류코드 메시지 호스트웨이 2012.08.24 10632
89 FTP 451 Error 해결 file 호스트웨이 2012.09.06 10597
88 Contacts Import 를 통한 Lync 연락처 Import file 호스트웨이 2012.08.24 10558
87 AD 사용자 속성에 사진 추가하는 방법 file 호스트웨이 2012.08.31 10265
86 도메인 컨트롤러간 통신을 위한 포트 호스트웨이 2012.10.05 10131
85 DNS 캐쉬 설정 호스트웨이 2012.12.13 9866
84 Windows 이벤트 에러메시지(이벤트 ID - 2020) 호스트웨이 2012.09.07 9754
» Cluster HeartBeat 호스트웨이 2012.09.07 9541
82 리소스 부족으로 프린터 작업을 계속할 수 없습니다 호스트웨이 2012.11.30 9468
81 Windows 로그온 유형 : Win32_LogonSession 호스트웨이 2012.09.07 9315
80 윈도우 2003 그룹 정책으로 Disk 할당량 적용 file 호스트웨이 2012.09.06 9295
79 ldifde.exe tool을 이용해서 현재 도메인의 개체들을 export 시키는 방법 호스트웨이 2012.11.15 9178
78 iso 이미지르 이용한 부팅 USB 만들기 file 호스트웨이 2012.08.31 9176