본문 바로가기
Reviews/읽자

[한빛리더스] 시스템 장애는 왜 두 번 일어났을까?

by Jany 2013. 4. 28.
반응형

이번 미션은 자율 미션 이었다.


관심있는 책이 있었지만, 기술책이 아니라 선뜻 사기엔 좀 아쉬웠던 책이 있어서


이번엔 그 책으로 골랐다.


이 책은 에세이!!


2011년에 일본 쓰나미로 인한 지진 의연금을 모금하던 은행에서 시스템 장애가 일어난 것이다.


그 은행에서 장애 조치한 내용을 에세이로 묶은 책이다.



시스템장애는 왜 두번 일어났을까?
국내도서
저자 : 닛케이 컴퓨터 편집부 / 이명희역
출판 : 한빛미디어 2012.07.01
상세보기


장애조치에 대한 이야기 이다 보니 많이 생각 하지 않고 편하게 읽어 갔다.


확실히 에세이라서 그런거 기술서 보단 편하게 읽혔다.


중간중간 실제 상황의 사진 들이 함께 있어서 몰입해서 읽을 수 있었다.



책 내용으로 살짝 들어가보면, 


여러가지 원인이 있는데,


은행 뿐 아니라 일반 적인 시스템 장애에 준하는 내용이었다.


장애시 보고 지연으로 인한 상황 대응의 미흡,


장애 조치 메뉴얼 미비,


시스템 개선 미흡 등 일반적인 시스템 장애들과 비슷한 이유들이었다.



특히 장애 조치 메뉴얼이 없어서 어떤 장애의 우선순위가 더 큰지 판단이 안되기에


하나의 장애로 인해 또 다른 장애를 낳고, 다른 장애가 또 다른 장애를 일으키면서


결국 장애 조치에 10일 이라는 시간이 걸렸다.



또한 은행 합병으로 인한 시스템 합병도 임원진에 IT 관련 임원의 부제로 제대로 관리 되지 못한 점등


여러가지 원인이 복합된 인재라고 봐도 무방할 정도다.



금융권 시스템이 아직도 기본은 코볼 프로그램에 자바로 래핑해서 WAS로 사용하고 있다는 얘기를 들었는데,


이 책을 한 번 읽어보면 얼마나 무시무시한 이야기인지 느끼게 될꺼 같다.



시스템 관리자로 수년간 일하면서 신입때 사고쳤던 생각도 나고, 


해킹으로 인한 장애를 수습할때도 생각나면서 다시 한번 되집어 볼 수 있는 그런 책이었다.



"장애를 해소 하려면 근본 원인 파악을 빠르게 하여 원인부터 해소 하여야 한다."








반응형

댓글