컴퓨팅 파워는 미래입니다. AI 시대의 방관자가 되지 마세요

51CTO가 GMI Cloud의 설립자 알렉스 예와 인터뷰를 통해 성공으로 가는 길에 대해 이야기했습니다

2025-04-18

Why managing AI risk presents new challenges

Aliquet morbi justo auctor cursus auctor aliquam. Neque elit blandit et quis tortor vel ut lectus morbi. Amet mus nunc rhoncus sit sagittis pellentesque eleifend lobortis commodo vestibulum hendrerit proin varius lorem ultrices quam velit sed consequat duis. Lectus condimentum maecenas adipiscing massa neque erat porttitor in adipiscing aliquam auctor aliquam eu phasellus egestas lectus hendrerit sit malesuada tincidunt quisque volutpat aliquet vitae lorem odio feugiat lectus sem purus.

  • Lorem ipsum dolor sit amet consectetur lobortis pellentesque sit ullamcorpe.
  • Mauris aliquet faucibus iaculis vitae ullamco consectetur praesent luctus.
  • Posuere enim mi pharetra neque proin condimentum maecenas adipiscing.
  • Posuere enim mi pharetra neque proin nibh dolor amet vitae feugiat.

The difficult of using AI to improve risk management

Viverra mi ut nulla eu mattis in purus. Habitant donec mauris id consectetur. Tempus consequat ornare dui tortor feugiat cursus. Pellentesque massa molestie phasellus enim lobortis pellentesque sit ullamcorper purus. Elementum ante nunc quam pulvinar. Volutpat nibh dolor amet vitae feugiat varius augue justo elit. Vitae amet curabitur in sagittis arcu montes tortor. In enim pulvinar pharetra sagittis fermentum. Ultricies non eu faucibus praesent tristique dolor tellus bibendum. Cursus bibendum nunc enim.

Id suspendisse massa mauris amet volutpat adipiscing odio eu pellentesque tristique nisi.

How to bring AI into managing risk

Mattis quisque amet pharetra nisl congue nulla orci. Nibh commodo maecenas adipiscing adipiscing. Blandit ut odio urna arcu quam eleifend donec neque. Augue nisl arcu malesuada interdum risus lectus sed. Pulvinar aliquam morbi arcu commodo. Accumsan elementum elit vitae pellentesque sit. Nibh elementum morbi feugiat amet aliquet. Ultrices duis lobortis mauris nibh pellentesque mattis est maecenas. Tellus pellentesque vivamus massa purus arcu sagittis. Viverra consectetur praesent luctus faucibus phasellus integer fermentum mattis donec.

Pros and cons of using AI to manage risks

Commodo velit viverra neque aliquet tincidunt feugiat. Amet proin cras pharetra mauris leo. In vitae mattis sit fermentum. Maecenas nullam egestas lorem tincidunt eleifend est felis tincidunt. Etiam dictum consectetur blandit tortor vitae. Eget integer tortor in mattis velit ante purus ante.

  1. Vestibulum faucibus semper vitae imperdiet at eget sed diam ullamcorper vulputate.
  2. Quam mi proin libero morbi viverra ultrices odio sem felis mattis etiam faucibus morbi.
  3. Tincidunt ac eu aliquet turpis amet morbi at hendrerit donec pharetra tellus vel nec.
  4. Sollicitudin egestas sit bibendum malesuada pulvinar sit aliquet turpis lacus ultricies.
“Lacus donec arcu amet diam vestibulum nunc nulla malesuada velit curabitur mauris tempus nunc curabitur dignig pharetra metus consequat.”
Benefits and opportunities for risk managers applying AI

Commodo velit viverra neque aliquet tincidunt feugiat. Amet proin cras pharetra mauris leo. In vitae mattis sit fermentum. Maecenas nullam egestas lorem tincidunt eleifend est felis tincidunt. Etiam dictum consectetur blandit tortor vitae. Eget integer tortor in mattis velit ante purus ante.

작성자: 51CTO 수석 편집장
원본: https://mp.weixin.qq.com/s/YthTgJEOlrXtL8NGeQz3TA
GMI Cloud에서 번역하고 가독성을 높이기 위해 편집했습니다.

Alex Yeh는 자신의 스타트업인 GMI Cloud를 “깊은 바다에서 살아남기 위해 고군분투하는 상어”에 비유하면서 지난 2년 반의 기업가적 여정을 회상했습니다.깊은 바다에는 보이지 않는 곳에 숨겨진 위험이 도사리고 있습니다. 그 주변을 항해하는 일은 생존과 발전을 위한 상어의 일상이 되었습니다.

알렉스는 2023년에 출범한 AI 네이티브 클라우드 제공업체인 GMI Cloud의 설립자이자 CEO입니다.그의 두 번째 스타트업입니다.Alex는 GMI Cloud를 설립하기 전 아시아 태평양 지역의 선도적인 사모펀드 및 벤처 캐피탈 회사에서 이사로 재직했습니다.그는 암호화폐 및 블록체인 분야의 최연소 파트너이기도 하며 100건 이상의 AI 관련 투자를 담당했습니다.

매일 발전이 일어나고 불확실성이 일상인 AI와 같은 분야에서는 은유가 특히 적절하다고 느껴집니다.하지만 알렉스가 말했듯이 현실은 훨씬 더 놀라운 경우가 많습니다.

2년 반 전, 알렉스는 GMI Cloud를 출시하기 위해 미국으로 이주했습니다.상당한 노력 끝에 그는 500헥타르 이상의 부지와 100메가와트 규모의 발전소를 확보하여 새로운 AI 인프라 벤처의 시작을 알렸습니다.불과 4개월 만에 그는 네 가지 주요 성과를 달성했습니다.

  1. Google X에서 기술 전문가를 영입했습니다.

  2. 글로벌 소프트웨어 배포 플랫폼 구축

  3. 국제 데이터 센터 건설

  4. 앵커 고객 확보

그리고 그것은 시작에 불과했습니다.알렉스는 “AI가 장기적으로 어떤 모습일지는 예측할 수 없다”고 말했다.“하지만 흔들리지 않는 항공모함처럼 10년 동안 사용할 수 있는 트루 노스 (True North) 가 필요합니다.”

DeepSeek R1이 출시된 후 2025년 초까지 전 세계 사용자들이 서둘러 이 모델을 시험해 보았습니다.GMI Cloud는 H200 하드웨어를 사용하여 DeepSeek-R1을 신속하게 배포, 조정 및 최적화했습니다.수요가 급증했지만 Alex의 전화벨은 끊이지 않았습니다.GMI Cloud는 이제 고급 하드웨어를 사용하여 AI 추론 성능과 토큰 처리량을 높이는 데 초점을 맞추고 있습니다.

올해 1분기에 GMI Cloud의 매출은 전년 대비 3배 증가했습니다.이러한 성장으로 인해 핵심 질문이 제기됩니다. 추론 시대에 사용자들이 AI 클라우드 서비스에서 원하는 것은 무엇일까요?GMI Cloud는 구글, 마이크로소프트, 아마존과 같은 거대 기업과 어떻게 경쟁할 수 있을까요?인프라와 애플리케이션 모두에서 어떤 변화가 일어나고 있을까요?

우리는 알렉스와 함께 80분 동안 대화를 나누며 알아냈습니다.

신중한 준비부터 전투까지

기술 혁신은 단기적으로는 과장되고 장기적으로는 과소평가되는 경향이 있습니다. 특히 AI에서는 더욱 그렇습니다.스타트업의 경우 가장 어려운 과제는 성장 이전의 조용한 시기를 버티는 것입니다.

DeepSeek R1이 출시되기 몇 달 전에 Alex는 전략적 결정을 내렸습니다. 바로 GMI Cloud가 강력한 추론 엔진을 빠르게 구축해야 한다는 것이었습니다.돌이켜보면 이는 피할 수 없는 일이었습니다.“대형 모델은 이미 충분히 훌륭했습니다.항공사 콜센터에서 AI 고객 서비스를 사용하고 앱을 통해 즉각적인 번역을 하는 것을 볼 수 있었습니다.다음 단계는 확실히 엣지 및 로컬 배포였는데, 이를 위해서는 지연 시간이 매우 짧아야 했습니다.”

그는 세 가지 주요 목표를 세웠습니다. 오토 스케일링, 글로벌 스케일링, 및 핫 스왑.처음 두 개는 간단한데 왜 핫 스왑을 해야 할까요?추론적으로 볼 때 시스템 다운타임은 큰 골치 아픈 일이기 때문입니다.핫 스와핑은 즉각적인 기계 교체를 통해 신뢰성을 보장합니다.

지난 3월, GMI Cloud는 99.995% 가동 시간 가용성을 갖춘 자체 개발한 추론 엔진 클라우드 플랫폼을 출시했습니다.

이러한 헤드스타트는 지난 6개월 동안 성과를 거두었습니다.2월에 DeepSeek R1이 폭발적으로 성장했을 때 고객 수요는 거의 전적으로 추론으로 바뀌었습니다.

수요와 함께 새로운 압력이 생겼습니다.AMD와 같은 하드웨어 제조사는 파트너에 손을 내밀었지만 Alex는 거절했습니다.“우리는 하드웨어 공급업체가 아니라 클라우드 회사입니다”라고 그는 말했습니다.제한된 리소스로 인해 GMI Cloud는 다양화가 아닌 확장에 초점을 맞춰야 합니다.

“DeepSeek R1은 해외를 지배하고 있으며 H200이 가장 적합합니다.우리 고객들은 고성능 추론을 필요로 합니다.너무 많은 칩 유형을 지원하면 속도가 느려질 수 있습니다.CoreWeave만큼 규모가 커지면 다각화를 다시 검토할 것입니다.”

엔지니어링 팀은 이제 긴급 경보 모드에 있습니다.“기술은 빠르게 움직이고 있습니다. NVIDIA는 일주일 후에 Dynamo를 중단하고 그 다음 주에 새로운 커뮤니티 보고서를 발표할 수도 있습니다.빠르게 파악하고 배포해야 합니다.”

앵커 고객을 찾고 끝없이 반복하세요

우리는 가설을 세웠습니다. 알렉스가 애플리케이션 스타트업을 만든다면 B2B로 갈까요, 아니면 B2C로 갈까요?

그의 대답은 B2B입니다.“수익을 창출하는 방식이 다릅니다.B2B에는 엔터프라이즈 지원이 필요합니다.B2C는 대규모 사용자 시나리오를 찾는 데 의존합니다.출시 후 피드백이 강렬하고 트렌드 사이클이 빠르게 움직입니다.”

그는 모든 AI 창시자가 일종의 슈퍼히어로라고 믿으며, 그의 초능력은 B2B에서 가장 잘 작동한다고 믿습니다.

그의 플레이북은 “절실하지만 단순하다”는 것입니다. 주요 고객을 찾고, 지속적으로 대화하고, 고객의 요구를 이해하고, 빠르게 반복하고, 서비스를 제공합니다.

Alex는 여전히 글로벌 소비자 (B2C) 시장에서 잠재력을 보고 있습니다.“중국 기업들은 소비재를 통해 세계로 진출하는 데 능숙합니다.이들은 실행, 프로모션, 하드웨어 통합, 오픈소스에 강하다.많은 새로운 오픈 소스 커뮤니티는 중국 팀이 이끌고 있습니다.이러한 지원을 받으면 수익을 창출하기 위해 직접 사이트를 구축할 필요도 없습니다.”

B2B이든 C2C이든 둘 다 기회를 제공합니다.예를 들어 텍스트를 이미지로 변환하거나 텍스트를 비디오로 변환할 수 있습니다. “C2C는 디자이너의 크리에이티브 스튜디오를 지원할 수 있습니다.B2B는 Adobe와 파트너 관계를 맺거나 버티컬 API를 제공할 수 있습니다.”

일반 요원을 향한 긴 여정

AI 에이전트가 아직 출시되지 않은 이유는 무엇일까요?

Alex는 범용 에이전트의 폭발적인 성장 시대는 아직 도래하지 않았다고 단호하게 결론지었습니다.한 가지 예를 들자면, 모델의 경우 주요 영역, 특히 실제 세계와의 상호 작용 능력에서 여전히 저조한 성과를 보이고 있습니다.둘째, 계산 비용이 여전히 너무 높아 진정한 비용 효율성을 보장할 수 없습니다.또한 애플리케이션 시나리오 간에는 지속적인 장벽이 존재하는데, 프라이빗 데이터 세트가 주요 원인입니다.이러한 데이터 세트를 통합하기 전까지는 에이전트가 고객에게 실제로 필요한 종류의 서비스를 제공하기가 어려울 것입니다.

하지만 AI 코딩 도구 (Cursor, Windsurf) 및 콘텐츠 생성기와 같은 틈새 사용 사례는 계속 증가하고 있습니다.

비용 측면에서는 DeepSeek가 출시된 이후 오픈 소스 모델이 일부 클로즈드 소스 모델보다 성능이 뛰어나기 시작했습니다.메모리 및 하드웨어에서 모델 아키텍처에 이르기까지 AI 인프라 전반이 지속적으로 개선됨에 따라 토큰당 비용은 꾸준히 하락하고 있습니다.낮은 정밀도의 구현과 더 효율적인 솔루션은 비용을 더욱 낮출 것으로 예상됩니다.

시나리오별 장벽을 극복하기 위해 다양한 업종의 독점 데이터를 보유한 기업은 각 도메인에 맞는 전문 에이전트를 구축할 수 있습니다.제품 경험이 충분히 풍부하면 고객은 자연스럽게 데이터를 더 기꺼이 맡길 것입니다.

알렉스는 이렇게 말했습니다. “현재 제 평가에 따르면 범용 에이전트 기술이 본격적인 혁신에 도달하기까지는 아직 갈 길이 멉니다.AIGC 및 텍스트-이미지 생성과 같은 분야에서는 여전히 가장 빠른 발전이 이루어지고 있습니다.하지만 앞으로 몇 년 안에 데이터 플라이휠 효과가 나타나면서 애플리케이션은 대규모로 의미 있는 상호 작용 데이터를 생성하기 시작할 것입니다.이러한 데이터는 더욱 강력한 멀티모달 모델의 원동력이 될 것이며, 이를 통해 차세대 혁신의 물결을 열 수 있을 것입니다.”

먼저 접근성을 높이고, 그 다음에는 품질을, 그 다음에는 가격을 제시하십시오.

데이터 관련 문제의 책임은 애플리케이션 계층에 있으며 비용 절감 부담은 GMI Cloud와 같은 클라우드 제공업체에 있습니다.

토큰 가격은 특히 국제적으로 높은 수준을 유지하고 있습니다.GMI Cloud는 프리필-디코드 디스애그리게이션 및 탄력성 프로비저닝과 같은 방법을 사용하여 성능 저하 없이 토큰 비용을 절감합니다.

가격 전쟁에 대해 Alex는 다음과 같이 직접 말합니다. “첫째, 고객은 가격 책정 전쟁을 원합니다. 존재합니다.그러면 그들은 그렇게 되기를 원하죠. 좋은.그러면 그들은 그렇게 되기를 원하죠. 싸구려.저렴하지만 신뢰할 수 없다면 쓸모가 없습니다.또는 미국에서 가장 저렴하지만 고객이 아시아에서 사업을 운영한다면 여전히 비용 효율적이지 않습니다.”

GPT-4o의 지브리 스타일 이미지 생성과 같은 최근의 사례는 추론 수요가 얼마나 빠르게 급증하여 OpenAI가 제한을 부과할 수 있는지를 보여줍니다.

그렇다면 비용은 얼마나 빨리 하락할까요?

Alex는 다음과 같이 예측합니다. 아주 빠르게.NVIDIA와 다른 업체들은 1~2년 주기마다 새로운 아키텍처를 출시합니다.매번 추론 비용이 절반으로 줄어들 수 있습니다.5년 이내에 0에 가까워질 수도 있습니다.

스케일링 법칙과 무어의 법칙은 두 가지 추세를 가리킵니다.

  1. 모델은 더 작아지고, 더 빠르고, 저렴해질 것입니다.

  2. 칩 제조업체들은 추론 비용을 낮추기 위해 경쟁할 것입니다

클라우드 제공업체는 계속해서 모델과 하드웨어를 통합할 것입니다.머지않아 토큰 가격에 병목 현상이 발생하지 않을 것입니다.

“AI의 쇼피파이”

2024년 10월, GMI Cloud는 시리즈 A에서 8,200만 달러를 모금했습니다. 시간이 흐르면서 Alex는 자신의 비전을 명확하게 전달할 방법을 개발했습니다.

“우리는 Shopify 오브 AI.”

Shopify는 세계적으로 인정받는 전자 상거래 플랫폼으로, 창립 이래 기업가와 영향력 있는 사람들이 신속하게 온라인 스토어를 개설하고 비즈니스 꿈을 추구할 수 있도록 지원하는 데 전념해 왔습니다.미국의 경우 한때 eBay와 Amazon이 시장을 장악했습니다. eBay와 Amazon은 기업가들을 제한된 유연성으로 경직된 생태계에 가두었습니다.Shopify는 크리에이터에게 보다 자율적이고 제어 가능한 대안을 제공함으로써 이러한 상황을 변화시켰습니다.

알렉스는 GMI Cloud의 사명에서 비슷한 점을 발견합니다.“지금까지 대부분의 혁신은 미국의 '빅 3' 클라우드 제공업체에만 국한되어 왔기 때문에 고객은 실질적인 부가가치 혁신을 이루기가 어려웠습니다.” 라고 그는 설명했습니다.“우리는 이러한 환경에 대한 통제권을 넘겨주고자 합니다. 환경 다시 우리 고객들에게.”

GMI Cloud는 이를 어떻게 달성할 수 있을까요?제품 설계의 유연성을 우선시함으로써요.플랫폼은 세 가지 핵심 구성 요소를 중심으로 구축되었습니다.GPU 인스턴스, 클러스터 엔진, 및 추론 엔진—별도로 구매하거나 함께 묶을 수 있습니다.고객은 필요에 따라 현지에서 학습한 모델을 배포하거나, GMI Cloud의 사전 최적화된 제품을 사용하거나, 타사 플랫폼을 통합하여 이러한 계층을 조합할 수 있습니다.GPU 리소스에도 벤더 종속이 전혀 없으므로 고객이 완전한 제어와 자율성을 유지할 수 있습니다.

엔비디아 GTC 2025에서 GMI Cloud는 서비스형 모델 (MaaS) 레이어로 가는 관문인 추론 엔진을 공식 출시했습니다.

Alex는 다음과 같이 설명했습니다. ML 배경이 없는 제품 팀을 위해 설계되었습니다.Inference Engine을 사용하면 기본 모델을 디버깅하는 것이 아니라 성장과 제품에 초점을 맞춥니다.마켓플레이스에서 모델을 선택하기만 하면 됩니다.

뉴 프론티어 인 더 플러드

그럼 다음은 무엇일까요?

Alex는 GMI Cloud의 3~5년 로드맵에 대해 질문을 받았을 때 “인터넷 AI”를 구축하겠다는 야심찬 비전을 제시했습니다.그는 “이 비전은 정말 흥미진진하다”고 말했다.“우리는 보이지 않는 GPU 클라우드 네트워크를 만들고자 합니다. 이는 스타트업과 기업 혁신가가 AI 아이디어를 실현할 수 있도록 힘을 실어주는 조용한 조력자입니다.우리는 현장의 모든 혁신과 긴밀하게 연계하면서 광범위한 AI R&D 사용 사례에 걸쳐 시나리오별 컴퓨팅 파워와 엔진 지원을 제공할 것입니다.우리의 목표는 AI 산업의 미래를 설계하는 데 도움을 주는 것입니다. 그저 가만히 서서 지켜보는 것이 아닙니다.”

그가 28개월 전에 설립한 GMI Cloud는 컴퓨팅부터 스토리지, 애플리케이션 계층에 이르기까지 모두 모듈화된 풀스택 AI 플랫폼으로 진화하고 있습니다.

“고급 호텔처럼: 여행 가방을 들고 체크인하고 편안하게 생활하세요.방에 있는 것이 마음에 들면 집에 가져갈 수 있어요.”

오늘 시작하세요

GMI Cloud를 사용해 보고 AI 요구 사항에 적합한지 직접 확인해 보세요.

시작해 보세요
14일 평가판
장기 커밋 없음
설정 필요 없음
온디맨드 GPU

에서 시작

GPU 시간당 4.39달러

GPU 시간당 4.39달러
프라이빗 클라우드

최저

GPU-시간당 2.50달러

GPU-시간당 2.50달러