액체 냉각 AI 서버가 병목 현상에 직면하다

Sep 30, 2024

메시지를 남겨주세요

 

 

 

Blackwell 칩 출하량이 증가함에 따라 고객의 액체 냉각 채택 의향도 높아질 것입니다.

업계 관계자는 액체 냉각 솔루션용 범용 급속 분리 장치(UQD) 공급이 부족해지고 있으며, 이는 AI 서버 액체 냉각 성장의 주요 병목 현상이 될 수 있다고 보고합니다.

 

서버 ODM 제조업체는 B100 및 B200을 포함한 Nvidia의 Blackwell AI 칩이 올해 배송을 시작할 예정이며 GB200 솔루션은 2024년 또는 2025년 말까지 대량 생산에 돌입하지 않을 것이라고 밝혔습니다. B100 및 B200의 대부분의 고객은 여전히 ​​공기 냉각 설계를 사용합니다. 그러나 ODM 제조업체들은 액체 냉각 보급률이 지속적으로 증가하고 있다고 보고하며 Blackwell 칩 출하량이 증가함에 따라 고객의 액체 냉각 채택 의지도 높아질 것으로 예상하고 있습니다.

 

Liquid-Cooled AI Servers

▲ 액체 냉각 AI 서버

 

 

I 증가하는 액체 냉각 수요를 충족하기 위한 용량 확장

 

관련 기업들은 새로운 액체냉각 시대를 맞이하기 위해 생산을 확대하고 있다. 열 모듈 제조업체인 Amlogic은 월별 수냉판 생산 능력을 30000에서 300000 단위로 늘릴 계획입니다.

 

Auras는 고객의 지정학적 우려와 요구 사항을 해결하기 위해 태국에 새로운 공장을 설립했습니다. 이 공장은 3분기부터 양산에 들어갈 예정이다. 냉각판의 현지 생산 능력을 확장하는 것 외에도 Auras는 냉각 분배 장치(CDU)와 냉각 유체 분배 매니폴드(CDM)를 현지에서 생산할 계획이며 월간 약 2,000-3,{{2 }} 세트.

 

열 모듈 제조업체인 AVC는 최근 실적 발표에서 중국과 베트남의 냉각판 모듈 월간 생산 능력이 약 115000단위라고 밝혔습니다. 냉각판으로 계산됩니다.

 

AVC는 연말까지 생산능력을 50% 확장할 계획이다. AVC는 또한 CDU의 월간 생산 능력을 1,{2}} 단위로, CDM의 월간 생산 능력을 30,000 세트로 늘릴 계획입니다. AVC는 이 계획된 용량이 고객 주문 수요에 따라 유연하게 조정될 수 있다고 강조했습니다.

 

Thermo Technology Company Goli Thermal Process는 액체 냉각에 대한 고객 수요 증가로 인해 대만 Zhongli 공장의 생산 능력을 확장하고 있습니다. 3분기 말까지 CDM의 월별 용량은 1,000 단위에서 2,000 단위로, 연말에는 4,{{5} 단위로 증가할 것으로 예상됩니다. } 단위, 연간 CDU 생산량도 연말까지 2,000 단위에 도달할 것으로 예상됩니다.

 

이들 제조업체는 주로 계산 효율성과 중국 및 EU의 데이터 센터 PUE 표준으로 인해 액체 냉각 수요에 대한 기대가 높지만, 가장 중요한 요인은 Nvidia가 칩 제조업체의 열 사양에 대해 자체 부과한 제한을 해제한 것입니다.

 

 

II 액체 냉각의 급속한 성장으로 인해 UQD 부족이 발생함

 

업계에서는 수냉식 시대의 도래를 간절히 기대하면서 UQD가 성장의 가장 큰 걸림돌이 됐다. 열 모듈 제조업체들은 최근 UQD 공급이 부족하다고 지적했습니다. 현재 수랭식 시장 점유율은 한 자릿수에 불과하지만, 향후 두 자릿수로 오른다면 UQD 획득이 어려워질 수도 있다.

 

UQD 공급업체는 주로 미국의 주요 기업인 Parker Hannifin 및 CPC, 스위스의 Staubli International, 덴마크의 Danfoss, 스웨덴의 Cejn 등 유럽과 미국에서 왔습니다. 대만의 커넥터 부품 대기업인 로테스(Lotes)도 적극적으로 시장에 진출하며 샘플 납품을 시작했다.

 

Anbo Technology의 Liang Zhijian 회장은 액체 냉각이 주로 누출을 방지하는 것을 목표로 하고 UQD가 가장 누출되기 쉬운 구성 요소이기 때문에 UQD 공급이 액체 냉각 구성 요소 중에서 가장 제한적이라고 지적했습니다. 이는 기술적인 문제만이 아닙니다. 관련 제조사들도 특허 보호를 받고 있으며 안보테크놀로지는 이러한 특허 장벽을 돌파할 수 있는 방법을 연구하고 있습니다.

 

업계 관계자는 UQD 제조업체가 특허 보호를 받고 있지만 OCP 인증 및 클라이언트 검증을 포함하여 시간과 노동 집약적인 여러 검증을 거쳐야 한다고 지적했습니다. 더욱이 기존 유럽과 미국 제조업체는 용량을 확장할 의도가 없으며 이는 액체 냉각의 급속한 발전에 주요 병목 현상이 될 것입니다.

 

Supermicro는 가장 빠르게 성장하는 액체 냉각 제조업체 중 하나입니다. 창립자 겸 CEO인 Liang Jianhou는 지난 30년 동안 액체 냉각이 서버 시장의 1%만을 차지했지만 2025년에는 보급률이 30%로 뛰어오를 것으로 추산했습니다.

 

 

III 잠재적인 솔루션으로서의 액체 냉각; AI 붐이 그리드에 압력을 가하다

 

생성적 인공지능의 급속한 발전으로 인해 데이터 센터가 전례 없이 확장되면서 전력망에 미치는 영향에 대한 우려가 커지고 있습니다. 이러한 에너지 집약적 시설은 정전 및 에너지 비용 증가로 이어질 수 있습니다. 전력 연구소(Electric Power Research Institute)의 추정에 따르면 2030년까지 데이터 센터는 미국 전력의 9%를 소비하여 현재 수치의 두 배에 이를 수 있습니다. 대규모 데이터센터의 전력 소비량은 수십만 가구의 전력 소비량과 맞먹는다.

 

특히 인공지능의 전력 수요 증가가 우려됩니다. 초기 AI 모델은 Google 검색에 비해 10배의 에너지를 소비했지만 최신 칩에는 훨씬 더 많은 전력이 필요합니다. 전문가들은 인공지능의 향후 발전이 충분한 전력을 생성하는 능력에 따라 제한될 수 있다고 경고합니다.

 

일부 국가는 심각한 문제에 직면해 있습니다. 예를 들어, 2026년까지 아일랜드에서는 전력의 30%를 데이터 센터 전용으로 사용할 수 있습니다. 미국의 경우 데이터센터 전력 소비량이 15개 주에 집중돼 있으며 텍사스와 버지니아주가 가장 높다. 캘리포니아는 새로운 데이터 센터가 원자력 발전소의 전력 수요를 초과하는 전력 수요를 생성할 것으로 예상되는 등 위기 상황에 처해 있습니다.

 

 

IV 데이터 센터: 엄청난 에너지 소비와 액체 냉각의 증가

 

인공 지능의 컴퓨팅 요구로 인해 서버 온도와 탄소 배출이 증가하고 있으며, 이로 인해 냉각 시스템에 대한 수요가 크게 증가하고 있습니다. 냉각 시스템은 데이터 센터 전체 전력 소비의 40%를 차지하며 서버 다음으로 두 번째로 큰 전력 소비원입니다. 글로벌 서버 냉각 시장은 2024년 200억 달러에서 2027년 900억 달러로 성장할 것으로 예상됩니다. 데이터 센터의 액체 냉각 시스템 시장은 1%에서 22%로 증가할 것으로 예상되며, 시장 가치는 3억 1,700만 달러에서 향후 3년간 78억 달러.

 

서버를 냉각시키기 위해 물이나 냉각수를 사용하는 액체 냉각 솔루션이 점점 인기를 얻고 있습니다. 새로운 기술에는 침수 냉각(전체 서버 랙을 비전도성 액체에 담그는 것)과 직접 액체 냉각(서버 주위에 물을 순환시키는 것)이 포함됩니다. 현재 공기 냉각 시스템보다 비싸지만 액체 냉각은 데이터 센터의 전력 소비를 10% 이상 줄일 수 있습니다.

 

조사 회사인 Global Market Insights는 데이터 센터의 전 세계 액체 냉각 시장이 2022년 21억 달러에서 2032년까지 122억 달러로 성장할 것으로 예측합니다. Uptime Institute의 조사에 따르면 데이터 센터 관리자의 16%가 액체 냉각이 기본 냉각이 될 것이라고 믿고 있는 것으로 나타났습니다. 방법을 사용하는 데 1-3년이 걸리고 41%는 4-6년이 걸릴 것이라고 생각합니다. 따라서 하이브리드 냉각 방식이 단기적으로 등장할 가능성이 더 높습니다.

 

데이터 센터용 공기 냉각 시스템 관리 부문의 선두주자인 Upsite Technologies는 기술이 지속적으로 발전하고 있지만 액체 냉각 장비는 여전히 열 방출을 위해 공기 냉각이 필요하기 때문에 단기적으로 100% 액체 냉각 데이터 센터를 달성하는 것은 불가능하다고 지적했습니다. . 액체 냉각이 더 효율적이기는 하지만 대규모로 구현하기가 어렵고 상당한 초기 투자가 필요합니다. 공기 냉각은 비용이 적게 들지만 효율성도 떨어집니다. 따라서 액체 냉각과 공기 냉각의 이점을 극대화하기 위해 하이브리드 냉각 시설이 점점 인기를 얻고 있습니다.

 

 

V 데이터 센터 에너지 위기로 인해 긴급 조치가 필요합니다

 

환경에 미치는 영향으로 인해 데이터 센터에 대한 조사가 강화되고 있습니다. 전 세계 정부는 에너지 소비와 탄소 배출량을 통제하기 위해 규정을 시행하고 있습니다. 중국의 "그린 데이터 센터" 지침과 독일, 싱가포르, 일본의 유사한 계획이 이러한 추세를 잘 보여줍니다. 슈나이더 일렉트릭(Schneider Electric)과 같은 업계 전문가들은 수자원 및 폐기물 발생과 같은 에너지 사용 이외의 요소를 포함하여 데이터 센터의 지속 가능성을 평가하기 위한 포괄적인 환경 지표의 필요성을 강조합니다.

 

미국 정부는 대규모 기술 기업에 청정 에너지에 투자하고 인공 지능의 전력 수요 증가가 환경에 미치는 중대한 영향을 인식하도록 압력을 가하고 있습니다.

 

 

VI 적합한 전원 찾기: 데이터 센터 및 에너지 과제

 

데이터 센터에는 증가하는 수요를 충족하는 동시에 신뢰성과 지속 가능성의 균형을 맞추기 위해 다양한 에너지 조합이 필요합니다. 태양광, 풍력 등 재생에너지원은 탄소발자국이 적기 때문에 매력적이다. 그러나 기상 조건에 대한 의존성은 불안정한 출력으로 이어질 수 있어 데이터 센터의 유일한 전원으로 적합하지 않습니다. 이러한 불일치를 보완하기 위해 중복 시설을 구축하는 것이 필요할 수 있지만 비용이 많이 듭니다.

 

원자력이 잠재적인 해결책으로 떠올랐다. 전통적인 원자력 발전소는 안정적인 기저부하 전력을 제공하여 데이터 센터 운영에 필수적인 안정적인 전력을 생산합니다. 또한, 세계 원자력 시장은 향후 10년간 꾸준한 성장을 이룰 것으로 예상됩니다.

 

원자력 부문의 혁신은 더욱 유망한 가능성을 제공합니다. 소형 모듈형 원자로(SMR)는 기존 원자력 발전소에 대한 더 작고 안전하며 확장 가능한 대안으로 개발되고 있습니다. 아직 연구 및 개발 단계에 있지만 SMR은 데이터 센터에 직접 배치되어 전용 청정 에너지를 제공할 가능성이 있습니다.

 

Global liquid cooling market (US$b)

▲ 글로벌 액체냉각 시장 (US$b)

 

 

그러나 SMR의 광범위한 채택은 심각한 장애물에 직면해 있습니다. 규제 및 제조 문제로 인해 상용 배포가 몇 년 정도 지연될 수 있습니다. 미국 정부는 비용을 절감하고 프로세스를 간소화하기 위해 거대 기술 기업과의 파트너십을 포함한 솔루션을 적극적으로 모색하고 있습니다.

 

데이터 센터 에너지 수요를 줄이는 또 다른 방법은 인공 지능 워크로드를 최적화하는 것입니다. 일부 AI 작업을 클라우드에서 더 작고 리소스 집약도가 낮은 AI 모델을 사용하는 로컬 장치로 전환하면 전체 에너지 소비를 줄일 수 있습니다.

 

향후 데이터 센터 개발에는 다각적인 접근 방식이 필요합니다. 원자력과 같은 신뢰할 수 있는 에너지원을 포함한 다양한 에너지 믹스를 채택하는 동시에 SMR과 같은 재생 가능하고 혁신적인 솔루션을 적극적으로 찾는 것이 필수적입니다. 또한 로컬 장치에서 AI 워크로드를 최적화하면 데이터 센터의 지속 가능성을 더욱 촉진할 수 있습니다.

 

 

 

문의 보내기