2012.11.14 17:44
증상별로 시스템에 대한 점검 해봐야 하는 분야들은 다를 수 있습니다.
하지만, 일반적으로 자주 발생하는 장애에 대한 점검 부분만 간략하게 소개 해드리도록 하겠습니다.
파티션 용량 점검
- 파티션이 가득 (100%) 차 버릴 경우 어플리케이션이 정상적으로 구동되지 못합니다.
usr의 경우에는 pid 파일이 정상적으로 생성되지 못하여 문제가 생기곤 합니다.
[hostway] /root > # df -Th
Filesystem Type Size Used Avail Use% Mounted on
/dev/sda1 ext3 1.9G 902M 887M 51% /
/dev/sda6 ext3 950M 19M 884M 3% /tmp
/dev/sda3 ext3 4.6G 943M 3.5G 22% /var
/dev/sda2 ext3 9.2G 3.7G 5.1G 42% /usr
/dev/sda7 ext3 80G 40G 40G 50% /home
이 경우 해당 파티션에서 용량이 큰 파일들이 찾아서 이동해주거나 비워주셔야 합니다.
해당 방법은 추후 업데이트.
서버 부하량 점검
서버의 지연현상 등이 발생할 경우 부하량 체크는 필수입니다.
load가 1이 넘어가기 시작하면 약간의 지연현상들이 발생하며, 5이상 정돠 되면 웹상에서도 느껴질 정도의
[hostway] /root > # w
08:31:52 up 139 days, 22:22, 4 users, load average: 0.26, 0.33, 0.35
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/2 1.1.1.1 Mon14 16:56m 0.10s 0.01s -bash
아래와 같이 CPU 점유율 순서대로 표시된다. munin-graph 가 현재 CPU 100%차지 하고 있는 것으로
이상증세인지 확인 해볼 필요가 있습니다.
[hostway] /root > # top
top - 08:32:44 up 139 days, 22:23, 4 users, load average: 0.10, 0.27, 0.32
Tasks: 115 total, 1 running, 108 sleeping, 6 stopped, 0 zombie
Cpu(s): 0.3%us, 0.3%sy, 0.0%ni, 99.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 1023252k total, 787996k used, 235256k free, 374648k buffers
Swap: 3911792k total, 31724k used, 3880068k free, 238680k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
12441 munin 30 10 16456 11m 4180 R 100.1 1.1 0:05.40 munin-graph
4098 root 20 0 246m 7132 888 S 0.3 0.7 197:38.38 zagent
로그 점검
서버의 중요 로그들을 살펴본다. 에러 로그가 쌓이진 않는지..
[hostway] /root > # dmesg
[hostway] /root > # vi /var/log/messages