Windows ETC

Cluster HeartBeat

2012.09.07 22:35

호스트웨이 조회 수:9768

클러스터 노드들은 Heartbeat 신호를 이용해서 노드의 OS레벨과 SQL 서버 레벨에서 살아있는지 확인한다.

SQL 서버 리소스를 호스팅하는 노드는 Service Control Manager 이용해서 5초마다 SQL 서버 서비스가 실행중인지 확인한다. "LooksAlive"확인은 성능에 영향을 주지 않는다. Running이면 성공이고 아니여도 운영상 문제는 없다. 보다 정확한 확인은 60초마다 수행되는 "IsAlive".

 

IsAlive:

  • 60초마다 실행
  • SQL 서버라면 @@SERVERNAME 구문을 이용해서 확인한다.
  • 모든 사용자 데이타베이스가 살아있는지 또는 요구되는 응답시간내에 수행되고 있는지를 보장하지 않는다.

 

IsAlive 확인 실패:

5 시도하고 SQL 서버 인스턴스에 다시 연결 시도흘 한다.

5 시도가 실패하면 서버 리소스는 fail 된다.

Failover threshold 설정 값에 따라 다르지만 failover Cluster 같은 노드에 있는 리소스를 모두 시작하거나 다른 가능한 노드로 failover 할것이다.

 

IsAlive 쿼리는 몇 개의 에러는 무시하지만 threshold 값을 초과하여 실패하면 fail이다.

 

SQL 서버 인스턴스가 failover되는 동안에 새로운 노드에서 SQL 서버 리소스가 시작되고 SQL 서버는 데이타베이스를 시작하기위해서 복구 프로세스를 진행한다. 서비스가 시작 후에는 master 데이타베이스가 살고, SQL 서버 리소스는 실행될 고려된다. 사용자 데이타베이스는 일반복구 프로세스가 진행된다. 트렌젝션 로그에 있는 완료된 트렌젝션은 롤퍼워드(rolled forward 또는 redo phase) 된다. 완료되지 않은 트렌젝션은 롤벡(rolled back 또는 undo phase)된다.

 

 

http://blogs.technet.com/b/rob/archive/2008/05/07/failover-clustering.aspx

SQL server enterprise에서는 각각의 사용자 데이타베이스는 사용 가능하다. 다른 에디션에서는(모든 SQL 2000 에디션 포함) 각각의 사용자 데이타베이스에 대해서 Undo Phase 완료 때까지 사용할 없다. 복구 프로세스의 처리 시간은 얼마나 많은 롤백이나 롤퍼워드같은 액티빅티가 필요하냐에 따라 다르다.

 

sp_configure 옵션의 "Recovery interval"은 복구 프로세스를 빠르게 하고 Redo recovery 시간이 길어지는 걸 방지하기 위해 낮은 값으로 설정된다. Undo recovery 시간은 트랜잭션을 짧게 처리함으로써 시간을 단축할 수 있다. 그래서 롤백되는데 커밋되지 않은 트랜잭션은 많지않다.

번호 제목 글쓴이 날짜 조회 수
157 AD 사용자 속성에 사진 추가하는 방법 file 호스트웨이 2012.08.31 10493
156 Contacts Import 를 통한 Lync 연락처 Import file 호스트웨이 2012.08.24 10770
155 도메인 컨트롤러간 통신을 위한 포트 호스트웨이 2012.10.05 10842
154 엔터프라이즈 위키 file 호스트웨이 2012.03.30 10846
153 HTTP 오류코드 메시지 호스트웨이 2012.08.24 10854
152 Windows Server2008/ Server2008R2 성능 카운터 리빌드 하는 밥업 호스트웨이 2012.12.06 10982
151 DHCP의 백업 및 복원 호스트웨이 2012.06.11 11127
150 FTP 451 Error 해결 file 호스트웨이 2012.09.06 11208
149 터미널 서비스 로그온, 로그오프시 중지되는 문제 호스트웨이 2012.06.11 11285
148 개체 엑세스 감사 file 호스트웨이 2012.05.11 11314
147 Wbadmin delete catalog 호스트웨이 2012.06.23 11319
146 DNS 캐쉬 설정 호스트웨이 2012.12.13 11329
145 Netsh advfirewall 컨텍스트 file 호스트웨이 2012.05.04 11487
144 DNS 캐쉬 설정 변경 방법 호스트웨이 2012.04.13 11614
143 가상 주소 공간 최대화 호스트웨이 2012.06.23 11671
142 FSMO(Flexible Single Master Operation) 역할 이전 호스트웨이 2012.04.20 11686
141 USB 저장 장치의 사용을 해제하는 방법 호스트웨이 2012.04.27 11774
140 [sharepoint 관리자] 대용량 전송 시 오류 호스트웨이 2012.07.14 11775
139 Sharepoint의 정보의 분류 체계 file 호스트웨이 2012.03.23 11783
138 DC 의 SYSVOL 폴더의 내용이 사라질 경우 호스트웨이 2012.11.01 11796