본문 바로가기
과학/물리학

세레브라스 시스템즈(Cerebras Systems): 엔비디아의 대항마

by 도서관경비원 2026. 5. 20.
반응형

 

AI 반도체 시장은 오랫동안 엔비디아의 독무대였다. GPU를 앞세운 엔비디아는 AI 인프라 시장의 80% 이상을 장악하며 '반도체 왕국'을 건설했다. 그런데 최근 실리콘밸리에서 이 구도를 흔들 파괴자가 등장했다. 바로 세레브라스 시스템즈(Cerebras Systems)다. 2026년 5월, 나스닥 상장 첫날 주가가 공모가(185달러) 대비 100% 이상 폭등하며 시가총액 약 950억 달러를 기록한 이 회사, 과연 어떤 기술을 갖고 있을까?


웨이퍼 스케일 엔진(WSE): '칩의 상식'을 깨부수다

세레브라스의 핵심은 웨이퍼 스케일 엔진(Wafer-Scale Engine, WSE)이라는 독창적인 반도체 설계 철학에 있다.

 

기존 반도체 제조 방식을 떠올려보자. 반도체 공장에서는 원형의 실리콘 웨이퍼 위에 수백 개의 칩 패턴을 새긴 뒤, 이를 잘게 잘라 개별 칩으로 만든다. 그리고 이 개별 칩들을 회로 기판 위에서 배선으로 연결해 서버를 구성한다. 세레브라스의 창업자 앤드루 펠드만(Andrew Feldman)은 이 방식 대신, 웨이퍼 전체를 하나의 거대한 단일 칩으로 만드는 전략을 택했다.

3D conceptual design of a wafer scale integrated circuit

최신 세대인 WSE-3의 스펙은 경이롭다. WSE-3은 지금까지 만들어진 AI 칩 중 가장 큰 칩으로, 면적 46,225mm²에 4조 개의 트랜지스터를 담고 있다. 90만 개의 AI 전용 코어를 통해 125 페타플롭스의 AI 연산 성능을 제공하는데, 이는 엔비디아 B200보다 트랜지스터 수는 19배, 연산 성능은 28배 높은 수준이다.

 

또한 기존 GPU 대비 고속 온칩 메모리는 3,000배, 메모리 대역폭은 10,000배 더 많다. 데이터를 칩 밖으로 보냈다가 다시 불러오는 병목 현상이 없으니 속도가 빠를 수밖에 없다.


웨이퍼를 통째로 쓰면 불량은? — '결함 내성 설계'의 비밀

여기서 당연한 의문이 생긴다. 웨이퍼를 통째로 칩으로 쓰면, 미세한 제조 결함이 발생했을 때 칩 전체가 망가지는 것 아닐까?

 

세레브라스는 이 문제를 '결함을 피하는 것'이 아니라 '결함을 견디는 것'으로 해결했다. 중복된 연산 코어, 중복된 라우팅 경로, 그리고 결함이 발생한 부분은 셧다운하고 우회하는 'fail-in-place' 아키텍처를 설계에 내재화했다. 공장에서 아무리 완벽하게 만들어도 생기는 불량을 소프트웨어와 하드웨어 설계로 흡수해버리는 방식이다.


속도가 곧 경쟁력: 엔비디아보다 얼마나 빠른가?

세레브라스의 가장 강력한 무기는 추론(Inference) 속도다.

 

2024년 8월 출시된 AI 추론 서비스는 엔비디아 H100 GPU 기반 시스템보다 10~20배 빠르다고 발표됐으며, 2025년 1월에는 DeepSeek R1 70B 모델을 초당 1,600 토큰 속도로 구동한다고 밝혔다. 같은 해 2월에는 미스트랄 AI의 Le Chat 서비스에 세레브라스 제품이 채택되며 속도 신기록을 달성했고, 퍼플렉시티 AI의 Sonar 모델은 세레브라스 칩 위에서 초당 1,200 토큰으로 동작했다.

 

한 암 신약 반응 예측 모델의 경우, 기존 GPU 대비 수백 배 빠르게 작동해 수년이 걸릴 신약 개발 과정을 불과 몇 달로 단축했다는 사례도 있다.


CS-3 시스템: 단 한 장의 칩이 수백 개의 GPU를 대체

WSE-3 칩은 CS-3라는 완성형 시스템 형태로 제공된다. CS-3는 단일 웨이퍼 스케일 칩으로 수백 개의 GPU를 대체하며, 단일 논리 장치에서 최대 24조 파라미터 규모의 모델까지 처리 가능하다. 서버실을 가득 채울 GPU 랙을 단 하나의 시스템으로 압축하는 셈이다. 전력 소비와 공간 효율 면에서도 획기적이다.


빅딜의 연속: OpenAI, AWS, 메이요 클리닉이 선택한 이유

기술력은 실제 계약으로 증명된다. 2026년 1월, 세레브라스는 OpenAI와 2028년까지 750메가와트의 컴퓨팅 파워를 제공하는 100억 달러 규모의 계약을 체결했다. 2026년 3월에는 AWS가 아마존 베드록에 배포될 트레이니엄 서버에 CS-3 시스템을 도입하기로 합의했다.

 

의료 분야에서도 세레브라스의 속도는 빛을 발했다. 2025년 1월, 메이요 클리닉은 게놈 데이터와 환자 기록을 결합해 치료 반응을 예측하는 연구에 세레브라스를 활용하겠다고 발표했다.


IPO와 현재: 950억 달러 신화와 남은 과제

2026년 5월, 세레브라스는 주당 185달러에 IPO를 진행해 약 55억 5,000만 달러를 조달했다. 상장 첫날 주가는 공모가 대비 100% 이상 급등했으며, 이는 2019년 우버 IPO 이후 미국 최대 기술 기업 IPO였다.

 

다만, 전체 매출의 약 86%가 UAE 연계 기관 두 곳에 집중되어 있다는 고객 편중 리스크는 여전히 투자자들이 주목하는 과제로 남아있다.


세레브라스가 바꿀 AI 반도체의 미래

세레브라스 시스템즈는 단순히 '엔비디아보다 빠른 칩'을 만든 회사가 아니다. 반도체 설계의 기본 전제를 뒤집는 새로운 패러다임을 제시했다. 웨이퍼 전체를 하나의 칩으로, 수백만 개의 코어와 방대한 온칩 메모리로, 그리고 추론 속도를 AI 서비스의 핵심 변수로 끌어올린 회사다. AI가 더 빠르고 저렴하게 작동해야 하는 시대, 세레브라스의 행보는 앞으로도 계속 주목할 필요가 있다. <끝>

반응형