컨테인먼트 투자 결정의 근거는?

컨테인먼트 도입 결정의 근거

시설을 개선하고자 하는 운영자에게 늘 따라다니는 질문은 비슷합니다.

“투자 비용 대비 효과는 어떠한가?”

“투자 비용을 회수하기 위한 기간은 얼마나 되는가?”

질문에 대답하기 위해서는 투자 효과에 대한 확신이 필요합니다. 효과를 확신하지 못하는 이유는 사전에 정량적으로 예측하기 어렵기 때문일 것입니다. 그런데, 효과를 논하기 위해서 앞서 해야 하는 질문이 있습니다.

“과연 우리 데이터 센터 냉각의 문제점은 무엇이지?”

 원인을 정확히 파악해야 그에 따른 여러가지 대책들을 논의할 수 있습니다. 비용 대비 효과는 이 시점에 이르러서야 비로소 얘기해 볼 수 있는 성질의 문제입니다.

 컨테인먼트 도입과 관련해서도 마찬가지입니다. 다양한 선택지가 눈앞에 놓여 있고, 운영자는 필히 선택을 해야 합니다.

냉복도에 채택할 것인지, 열복도에 채택할 것인가.

일괄적으로 교체해야 하나, 부분적으로 적용해야 하나.

 하지만 어떠한 결정을 내리든 이 질문에 답해야 합니다.

“적용하면 얼마나 개선되는가?”

 

여기 컨테인먼트 도입을 검토하고 있는 데이터 센터가 있습니다.

설계 용량까지 아직 여유가 있음에도 핫스팟이 군데 군데 발생하고 있습니다.

설계 시점에는 냉각과 관련하여 가장 효율적인 방안을 고려했을 것입니다.

그러나 운영 시점에 어떤 장비를 어떻게 가동할 것인지는 설계 시점에 예측할 수 있는 성질의 항목이 아닙니다.

현재 실장된 IT 서버들은 심지어 설계 당시에는 존재조차 하지 않던 것들이 다수일 테니 말입니다.

그림 1. 캐비닛 소모전력

그림 2. 캐비닛 과열

그림 1은 각 캐비닛 당 현재 소모전력을 표시하고 있습니다.

그림 2는 캐비닛의 입구 온도가 허용 범위를 초과하는지 여부를 보여줍니다.

빨간색으로 표시된 캐비닛은 허용범위를 벗어난 것입니다.

주황색은 여유가 부족한 상태를 의미하고, 녹색은 안전한 범위 내에 있음을 의미합니다.

군데 군데 핫스팟이 존재하고, 몇몇 캐비닛들이 이미 허용범위를 벗어나서 운영되고 있는 상태입니다.

여기서 먼저 눈여겨 봐야 하는 것은 캐비닛의 소모전력과 과열된 캐비닛의 위치가 반드시 상관관계를 갖고 있지는 않다는 사실입니다.

핫스팟이 발생하는 위치를 사전에 예측하기가 그리 쉽지 않다는 뜻입니다.

 

투자 비용등을 고려해서 부분적으로 냉복도 컨테인먼트를 도입하기로 결정했다고 생각해 보겠습니다.

그림 3. 부분적으로 냉복도 컨테인먼트 적용

외곽부터 컨테인먼트를 적용한 이유는 해당 열(Row)에 과열된 캐비닛이 다수 있고, 오른쪽 그림처럼 고발열의 블레이드 서버가 집중적으로 설치되어 있기 때문입니다.

컨테인먼트 도입 전후의 온도 결과는 과연 어떨까요?

온도나 기류의 개선 정도에 대한 기대를 충족시킬 수 있을까요?

 

아래 그림은 컨테인먼트 도입 전/후의 각 캐비닛 입구 온도 비교 결과입니다.

그림 4. 컨테인먼트 적용 열(Row) 캐비닛 실장 사례

그림 5. 컨테인먼트 도입 전 각 캐비닛 입구 공기 평균 온도

그림 6. 컨테인먼트 도입 후 각 캐비닛 입구 공기 평균 온도

컨테인먼트가 도입된 영역의 입구 온도가 감소했음을 알 수 있습니다.

문제는 ‘얼마나’ 감소하는가입니다.

처음처럼 과열 정도를 표시해 보면 다음 그림과 같습니다.

 

그림 7. 컨테인먼트 도입 전 각 캐비닛 과열

그림 8. 컨테인먼트 도입 후 각 캐비닛 과열

물론 해소되는 영역들이 있습니다.

그렇지만 오히려 나빠지는 영역들도 발생합니다.

컨테인먼트를 도입하면 개선되리라던 막연한 기대를 품고 있었다면 이런 결과는 당혹스럽게 느껴질 것입니다.

 

컨테인먼트를 전체 룸에 적용하지 않아서 그런걸까요? 전체에 적용하면 어떨까요?

그림 9. 룸 전체 컨테인먼트 적용 모델

그림 10. 전체 컨테인먼트 도입 후 각 캐비닛 과열

여전히 과열 상태인 캐비닛이 많이 남아있다는 사실은 시설 투자를 결정하고 보고한 운영자에겐 매우 곤혹스러운 일일 수 있습니다.

 

어떠한 오해도 없길 바랍니다.

컨테인먼트의 도입이 불필요하다는 주장을 펼치는 것이 아닙니다.

시설에 변화를 추구할 때에는 원인을 정확히 파악하는 작업이 선행되어야 하고, 도입에 따르는 부수적 효과들을 함께 검증해야 한다는 사실을 강조할 뿐입니다.

우리가 살펴본 위 시설의 원인 파악을 제대로 하고 조치를 취하면 컨테인먼트를 도입한 후 결과는 아래 그림처럼 나오게 됩니다.

그림 11. 부가적인 문제를 해결한 후 각 캐비닛 과열

운영자의 바람과는 무관하게 데이터센터의 냉각을 좌우하는 요소는 단순하지 않고 매우 복합적입니다.

시설의 한 가지 요소를 변경하면 다른 요소들에도 영향을 미치게 마련입니다.

따라서 시설에 변경을 가하려면, 사전에 그 변경으로 인해 발생할 수 있는 다른 요인들도 함께 예측 및 평가해야 합니다.

운영자들이 시설 개선 아이디어를 도출하기 위해 경험과 직관은 여전히 중요한 덕목입니다.

그렇지만 정량적으로 아이디어들을 평가할 수 없다면, 경험과 직관에만 의존한 결정은 위험을 수반할 수 밖에 없습니다.

 

다시 처음 질문으로 돌아가야 합니다.

우리 시설에 새로운 냉각 시스템을 도입하면 얼마나 개선되는가?

정량적으로 데이터를 산출해야 비용을 계산할 수 있습니다.

정밀한 CFD 해석은 이전에 볼 수 없었던 인사이트를 추가로 제공해 줄 것입니다.

6SigmaDCX는 현존하는 가장 정밀한 데이터센터 전용 CFD 도구입니다.

 

다음 번에는 이 시설의 문제가 무엇이었는지 원인을 따져보기로 하겠습니다.