AI 시대, 승자는 모델이 아닌 '추론 소프트웨어'? 모레, 딥시크 사례로 밝힌 AI 전쟁의 핵심!
AI 경쟁의 새로운 국면: 모델 아키텍처를 넘어선 인프라 소프트웨어의 중요성
모레는 인공지능(AI) 시대의 경쟁력이 모델 아키텍처가 아닌 인프라 소프트웨어에 달려 있다고 선언하며, 엔비디아의 대안 생태계를 위한 핵심 소프트웨어를 제공하여 AI의 '개발 속도'와 '추론 비용' 경쟁을 주도하겠다는 포부를 밝혔다. 24일 서울 양재 aT센터에서 열린 'lab ¦ up > /conf/5'에서 조강원 모레 대표는 딥시크 사례를 통해 AI 경쟁의 본질 변화를 심도 있게 분석했다.
딥시크, 숨겨진 비밀 병기: '추론 소프트웨어'를 통한 비용 효율 혁신
조 대표는 딥시크의 진짜 혁신은 모델 자체가 아니라고 단언하며, 딥시크가 공개하지 않은 진짜 비밀 병기는 경쟁사의 5분의 1 비용으로 서비스를 운영하는 '추론 소프트웨어'라고 강조했다. AI 전쟁의 핵심이 비용 효율로 넘어왔음을 시사하며, '달러 퍼 토큰' 즉, 토큰당 비용을 줄이는 데 사활을 걸고 있는 AI 산업의 현실을 짚었다.
비용 전쟁의 게임 체인저: 분산 추론 기술의 부상
현재 AI 산업은 동일 퀄리티 모델의 서비스 비용이 매년 10분의 1씩 줄어드는 상황에서 치열한 최적화 경쟁을 벌이고 있다. 이 같은 비용 전쟁의 '게임 체인저'로 '분산 추론' 기술이 부상했으며, 조 대표는 분산 추론을 통해 서버 100대로도 200배, 심지어 1천 배의 성능을 낼 수 있다고 강조하며, 이제 모든 데이터센터가 반드시 해야 하는 기술이라고 역설했다.
모레의 해결책: MoAI 추론 프레임워크
모레는 분산 추론 문제를 해결하기 위해 '모아이(MoAI) 추론 프레임워크'를 개발하고 있으며, 이 프레임워크는 수많은 분산 기법들을 자동으로 조합해 최적의 실행 계획을 수립하는 '자동화된 분산·라우팅 엔진'을 핵심으로 한다. 모아이 프레임워크는 연산 성능이 높은 AMD 그래픽 처리장치(GPU)와 메모리 대역폭이 강점인 다른 GPU를 섞어 쓰는 식으로 전체 비용 효율을 53% 개선하는 것을 목표로 한다.
이종 가속기 혼용과 인프라 효율 극대화
모아이 프레임워크의 궁극적인 지향점은 '이종 가속기'의 혼용이며, 짐 켈러가 이끄는 텐스토렌트의 칩까지 조합하여 소프트웨어를 통해 전체 인프라 효율을 극대화하는 솔루션을 개발 중이다. 이를 통해 모레는 AI 모델의 성능과 비용을 좌우하는 가장 비판적인 요소인 인프라 소프트웨어 분야에서 최고가 되겠다는 비전을 제시했다.
미래 기술을 위한 투자: 자체 파운데이션 모델 개발
모레는 자회사 모티프를 통해 자체 파운데이션 모델도 직접 개발하며, 이는 구글이 텐서플로우처리장치(TPU)와 제미나이 모델을 함께 개발하며 시너지를 내는 것과 같은 전략이다. 조강원 대표는 과거에 번들 소프트웨어로 취급받던 인프라 소프트웨어의 역할이 근본적으로 바뀌고 있으며, 이제는 AI 모델의 성능과 비용을 좌우하는 가장 비판적인 요소가 됐다고 강조했다.
핵심만 콕!
모레는 딥시크 사례를 통해 AI 경쟁의 본질이 모델 아키텍처에서 인프라 소프트웨어로 이동했음을 강조하며, 분산 추론 기술과 MoAI 프레임워크를 통해 비용 효율성을 극대화하고, 자체 파운데이션 모델 개발을 통해 미래 기술 경쟁력을 확보하려는 전략을 제시했다.
독자들의 Q&A
Q.딥시크가 공개하지 않은 비밀 병기는 무엇인가요?
A.경쟁사의 5분의 1 비용으로 서비스를 운영하는 '추론 소프트웨어'입니다.
Q.분산 추론 기술은 어떤 장점을 가지고 있나요?
A.서버 100대로도 200배, 심지어 1천 배의 성능을 낼 수 있습니다.
Q.모레가 개발 중인 MoAI 프레임워크의 핵심 기술은 무엇인가요?
A.수많은 분산 기법들을 자동으로 조합해 최적의 실행 계획을 수립하는 '자동화된 분산·라우팅 엔진'입니다.