Company

어떻게 작은 스타트업이 글로벌 빅테크 기업들을 제치고 비디오 검색 1위를 차지했을까 (1부 — 동기 편)

이승준

자원과 수단을 기발하게 활용하며 뚜렷한 목표를 향해 나아가는 약자는 언제나 결국 승리합니다.

자원과 수단을 기발하게 활용하며 뚜렷한 목표를 향해 나아가는 약자는 언제나 결국 승리합니다.

In this article

No headings found on page

뉴스레터 구독하기

뉴스레터 구독하기

영상 이해 분야의 최신 기술 업데이트, 튜토리얼 및 인사이트를 받아보세요.

영상 이해 분야의 최신 기술 업데이트, 튜토리얼 및 인사이트를 받아보세요.

AI로 영상을 검색하고, 분석하고, 탐색하세요.

2022. 3. 16.

3분

링크 복사하기

고객과 투자자들로부터 자주 받았던 질문이 하나 있습니다.

"여러분의 기술은 구글이나 마이크로소프트와 어떻게 비교되나요?"

그들이 진짜로 묻고 싶었던 질문은 아마 이것이었을 겁니다...

"여러분의 기술이 구글이나 마이크로소프트보다 더 뛰어난가요?"

참 답하기 어려운 질문입니다. 딥테크 AI 스타트업에게는 더욱 그렇습니다. 특히 창업자들이 굵직한 논문 실적이 없거나 학계 출신이 아니라면 말이죠. 대답은 보통 다음 두 가지 경로 중 하나로 귀결됩니다.

  1. 불도저 전략: "네, 저희가 더 뛰어납니다! 여기 경쟁사의 벤치마크 성능이 있고, 저희 성과가 여기 있습니다."
    → 반응: 의구심, 질문 공세, 때로는 거부감까지

  2. 우회 전략: "저희는 더 나은 사용성을 제공하며 특정 고객층을 위한 기능을 구축할 수 있습니다. 이미 고객들이 매우 만족하고 계십니다!" (기술 대신 제품과 고객에 대해 이야기)
    → 반응: 설득은 될 수 있지만 여전히 아쉬운 기색

우리는 다른 기업들보다 우수한 벤치마크 성능을 가졌음에도 항상 2번 전략을 선택했습니다. 이를 통해 우리 고객에 관해 자연스럽게 이야기할 수 있었고, 무엇보다 우리의 제품과 비전에 동참하게 만들고 싶었던 분들과 굳이 논쟁을 벌이고 싶지 않았기 때문입니다!

AI 연구와 제품 개발을 주도하는 기술 창업자로서 저는 종종 맥이 빠지곤 했습니다. 매번 같은 질문이 반복될 때마다 신경쇠약에 걸릴 정도로 무력감을 느꼈습니다. 최고의 기술을 가지고 있음을 확신하며 밤낮으로 고생하는 팀원들에게 끊임없이 "미안하다"는 말을 되풀이해야 했습니다.

그때, 마이크로소프트가 주최하는 ICCV VALUE(Video-And-Language-Understanding-Evaluation) Challenge에 참여해야겠다고 결심했습니다. 챌린지는 이미 2주 전에 시작된 상태였지만, 그게 무슨 상관이겠습니까? 우리를 증명할 완벽한 기회였습니다.

이유는 세 가지였습니다.

  1. 챌린지의 과제가 우리 사업의 핵심인 비디오 검색 AI 모델의 성능을 평가하는 비디오 검색(Video Retrieval)이었습니다.

  2. 서로 다르고 다양한 4개 영역의 벤치마크 비디오 데이터셋을 활용하여 객관적이고 완전한 평가가 이루어질 예정이었습니다.

  3. 마이크로소프트, 텐센트, 바이두 같은 가장 권위 있는 AI 기관과 기술 대기업들이 호스트이자 참가자로 참여하는 대회였기에 이들과 직접 경쟁해 볼 기회였습니다.

우리가 이 대회에서 우승한다면 신뢰도 확보, 브랜딩, 홍보, 채용, 자신감 등 얻을 수 있는 것이 정말 많았습니다. 그리고 가장 중요한 것은, 고객과 투자자들이 "구글보다 더 나은가요?"라는 질문을 던질 때 강력한 '불도저식' 답변을 돌려줄 수 있게 된다는 것이었습니다.

우승 시 누리게 될 매력적인 기회들을 뒤로하고, 객관적인 조건은 우리에게 너무나도 불리했습니다.

  1. 여러 모델을 동시에 학습시키는 데 투입할 수 있는 클라우드 GPU 자원이 부족했습니다. 당시 우리가 대회에 쓸 수 있었던 예산은 5만 달러가 전부였습니다. 테크스타즈(Techstars)에 합류하면서 받은 10만 달러 규모의 AWS 무료 크레딧 중에서 5만 달러는 이미 소진한 상태였습니다. 이 정도 규모의 대회에서 5만 달러 상당의 컴퓨팅 사양은 없는 것과 다름없었습니다.

  2. 인적 자원이 턱없이 부족했습니다. 회사 전체 인원이 10명 미만이었습니다. 10명 중에서 엔지니어가 아닌 인원을 제외하고, 베타 고객들과의 PoC 업무 및 제품 개발에 집중해야 하는 엔지니어들을 빼고 나면...? 저를 포함해서 엔지니어는 단 2명뿐이었습니다.

  3. 모델 학습에 활용할 수 있는 데이터셋이 한정적이었습니다. 자체 모델 프리트레이닝을 위해 무한한 양의 비디오를 보유하고 있는 대기업들과 달리, 우리가 선택할 수 있는 유일한 옵션은 누구에게나 공개된 공공 비디오 데이터셋을 활용하는 것뿐이었습니다.

그래서 저는 우승할 확률이 10% 미만이라고 생각했지만, 그럼에도 도전을 결정했습니다. 어떤 스타트업이든 어느 시점에는 도약에 대한 굳은 믿음을 갖고 이기는 마인드로 무장해야 합니다. 스타트업계의 격언처럼, 아무것도 하지 않으면 확률은 언제나 0%이니까요.

다음 포스트: 파트 2 — ICCV VALUE Challenge의 실전 상세 분석

고객과 투자자들로부터 자주 받았던 질문이 하나 있습니다.

"여러분의 기술은 구글이나 마이크로소프트와 어떻게 비교되나요?"

그들이 진짜로 묻고 싶었던 질문은 아마 이것이었을 겁니다...

"여러분의 기술이 구글이나 마이크로소프트보다 더 뛰어난가요?"

참 답하기 어려운 질문입니다. 딥테크 AI 스타트업에게는 더욱 그렇습니다. 특히 창업자들이 굵직한 논문 실적이 없거나 학계 출신이 아니라면 말이죠. 대답은 보통 다음 두 가지 경로 중 하나로 귀결됩니다.

  1. 불도저 전략: "네, 저희가 더 뛰어납니다! 여기 경쟁사의 벤치마크 성능이 있고, 저희 성과가 여기 있습니다."
    → 반응: 의구심, 질문 공세, 때로는 거부감까지

  2. 우회 전략: "저희는 더 나은 사용성을 제공하며 특정 고객층을 위한 기능을 구축할 수 있습니다. 이미 고객들이 매우 만족하고 계십니다!" (기술 대신 제품과 고객에 대해 이야기)
    → 반응: 설득은 될 수 있지만 여전히 아쉬운 기색

우리는 다른 기업들보다 우수한 벤치마크 성능을 가졌음에도 항상 2번 전략을 선택했습니다. 이를 통해 우리 고객에 관해 자연스럽게 이야기할 수 있었고, 무엇보다 우리의 제품과 비전에 동참하게 만들고 싶었던 분들과 굳이 논쟁을 벌이고 싶지 않았기 때문입니다!

AI 연구와 제품 개발을 주도하는 기술 창업자로서 저는 종종 맥이 빠지곤 했습니다. 매번 같은 질문이 반복될 때마다 신경쇠약에 걸릴 정도로 무력감을 느꼈습니다. 최고의 기술을 가지고 있음을 확신하며 밤낮으로 고생하는 팀원들에게 끊임없이 "미안하다"는 말을 되풀이해야 했습니다.

그때, 마이크로소프트가 주최하는 ICCV VALUE(Video-And-Language-Understanding-Evaluation) Challenge에 참여해야겠다고 결심했습니다. 챌린지는 이미 2주 전에 시작된 상태였지만, 그게 무슨 상관이겠습니까? 우리를 증명할 완벽한 기회였습니다.

이유는 세 가지였습니다.

  1. 챌린지의 과제가 우리 사업의 핵심인 비디오 검색 AI 모델의 성능을 평가하는 비디오 검색(Video Retrieval)이었습니다.

  2. 서로 다르고 다양한 4개 영역의 벤치마크 비디오 데이터셋을 활용하여 객관적이고 완전한 평가가 이루어질 예정이었습니다.

  3. 마이크로소프트, 텐센트, 바이두 같은 가장 권위 있는 AI 기관과 기술 대기업들이 호스트이자 참가자로 참여하는 대회였기에 이들과 직접 경쟁해 볼 기회였습니다.

우리가 이 대회에서 우승한다면 신뢰도 확보, 브랜딩, 홍보, 채용, 자신감 등 얻을 수 있는 것이 정말 많았습니다. 그리고 가장 중요한 것은, 고객과 투자자들이 "구글보다 더 나은가요?"라는 질문을 던질 때 강력한 '불도저식' 답변을 돌려줄 수 있게 된다는 것이었습니다.

우승 시 누리게 될 매력적인 기회들을 뒤로하고, 객관적인 조건은 우리에게 너무나도 불리했습니다.

  1. 여러 모델을 동시에 학습시키는 데 투입할 수 있는 클라우드 GPU 자원이 부족했습니다. 당시 우리가 대회에 쓸 수 있었던 예산은 5만 달러가 전부였습니다. 테크스타즈(Techstars)에 합류하면서 받은 10만 달러 규모의 AWS 무료 크레딧 중에서 5만 달러는 이미 소진한 상태였습니다. 이 정도 규모의 대회에서 5만 달러 상당의 컴퓨팅 사양은 없는 것과 다름없었습니다.

  2. 인적 자원이 턱없이 부족했습니다. 회사 전체 인원이 10명 미만이었습니다. 10명 중에서 엔지니어가 아닌 인원을 제외하고, 베타 고객들과의 PoC 업무 및 제품 개발에 집중해야 하는 엔지니어들을 빼고 나면...? 저를 포함해서 엔지니어는 단 2명뿐이었습니다.

  3. 모델 학습에 활용할 수 있는 데이터셋이 한정적이었습니다. 자체 모델 프리트레이닝을 위해 무한한 양의 비디오를 보유하고 있는 대기업들과 달리, 우리가 선택할 수 있는 유일한 옵션은 누구에게나 공개된 공공 비디오 데이터셋을 활용하는 것뿐이었습니다.

그래서 저는 우승할 확률이 10% 미만이라고 생각했지만, 그럼에도 도전을 결정했습니다. 어떤 스타트업이든 어느 시점에는 도약에 대한 굳은 믿음을 갖고 이기는 마인드로 무장해야 합니다. 스타트업계의 격언처럼, 아무것도 하지 않으면 확률은 언제나 0%이니까요.

다음 포스트: 파트 2 — ICCV VALUE Challenge의 실전 상세 분석