미디어·엔터테인먼트

어떤 영상에서든, 무엇이든 찾아냅니다.

시각, 오디오, 대사, 모션(움직임) 데이터를 36개 언어에 걸쳐 통합 처리하는 영상 임베딩 모델. 프로덕션 검색에 바로 사용할 수 있는 단일 512차원 벡터를 반환합니다.

시각, 오디오, 대사, 모션(움직임) 데이터를 36개 언어에 걸쳐 통합 처리하는 영상 임베딩 모델. 프로덕션 검색에 바로 사용할 수 있는 단일 512차원 벡터를 반환합니다.

4시간

연속된 영상과 오디오를 전체 시간 맥락까지 반영해 처리합니다.

36+

글로벌 스케일의 검색. 번역을 거치지 않는 36개국어 네이티브 쿼리 지원.

512차원

Amazon Nova 대비 6배 더 작고 효율적인 임베딩 차원.

30×

Amazon Nova를 뛰어넘는 인덱싱 속도, 그리고 업계를 선도하는 정확도.

Marengo만이 할 수 있는 일

(기존의) 다른 파운데이션 모델들은 짧은 영어 영상의 '텍스트-투-클립(Text-to-clip)'/텍스트-클립 검색 수준에 머무릅니다. 반면 Marengo는 이를 넘어, 실제 엔터프라이즈 프로덕션 환경이 요구하는 복잡하고 방대한 검색 작업을 (완벽히) 수행합니다.

(기존의) 다른 파운데이션 모델들은 짧은 영어 영상의 '텍스트-투-클립(Text-to-clip)'/텍스트-클립 검색 수준에 머무릅니다. 반면 Marengo는 이를 넘어, 실제 엔터프라이즈 프로덕션 환경이 요구하는 복잡하고 방대한 검색 작업을 (완벽히) 수행합니다.

512차원으로 더 가볍게, 이해력은 그대로.

Marengo는 영상을 고효율 512차원 임베딩으로 인코딩하여, 정확도 손실 없이 검색 속도를 높이면서 스토리지 사용량을 Amazon Nova 대비 6분의 1 수준으로 절감합니다.

이미지와 텍스트, 단 하나의 쿼리로.

특정 선수의 사진을 업로드하고 한두 줄의 설명을 추가하면, Marengo가 이를 하나의 벡터 임베딩으로 정교하게 결합합니다. 하나의 쿼리 안에서 이미지, 텍스트, 오디오 요소를 자유롭게 조합하여 다각도로 검색할 수 있습니다.

36개 언어, 하나의 벡터 공간.

Marengo의 통합 벡터 공간에서 별도의 번역 단계 없이 36개 언어를 교차 검색할 수 있습니다. 언어 간 전환에 따른 정확도 손실은 발생하지 않습니다.

예시 프레임으로 검색하세요.

이미지 쿼리에 텍스트를 더해, 영상 속 일치하는 순간을 찾아냅니다.

가입에서 첫 결과까지, 단 5분.

동일한 모델, 동일한 프롬프트, 동일한 JSON 출력. 팀에 맞는 인터페이스를 선택하세요.

동일한 모델, 동일한 프롬프트, 동일한 JSON 출력. 팀에 맞는 인터페이스를 선택하세요.

Python
Node.js
1import requests
2 
3# Step 2: Define the API URL and the specific endpoint
4API_URL = "https://api.twelvelabs.io/v1.3"
5INDEXES_URL = f"{API_URL}/indexes"
6 
7# Step 3: Create the necessary headers for authentication
8headers = {
9 "x-api-key": "<YOUR_API_KEY>"
10}
11 
12# Step 4: Prepare the data payload for your API request
13INDEX_NAME = "<YOUR_INDEX_NAME>"
14data = {
15 "models": [
16 {
17 "model_name": "marengo3.0",
18 "model_options": ["visual", "audio"]
19 }
20 ]
21}

Quick Start

첫 영상을 인덱싱하고, 5분 안에 검색까지 실행해보세요.

샘플 앱

프로덕션용 레포: 영상 검색, 영상 기반 RAG, 하이라이트 릴 생성기, 컴플라이언스 스캐너.

MCP 서버

Claude, Cursor 등 모든 MCP 클라이언트를 영상 인덱스에 손쉽게 연동하세요.

SDK 및 API

Python, Node, REST 완벽 지원. 상세한 API 레퍼런스와 타입 기반 응답, 스트리밍 기능까지 제공합니다.

Quick Start

첫 영상을 인덱싱하고, 5분 안에 검색까지 실행해보세요.

샘플 앱

프로덕션용 레포: 영상 검색, 영상 기반 RAG, 하이라이트 릴 생성기, 컴플라이언스 스캐너.

MCP 서버

Claude, Cursor 등 모든 MCP 클라이언트를 영상 인덱스에 손쉽게 연동하세요.

SDK 및 API

Python, Node, REST 완벽 지원. 상세한 API 레퍼런스와 타입 기반 응답, 스트리밍 기능까지 제공합니다.

더 빠르게, 더 작게, 더 정확하게

Marengo는 벤치마크나 데모, 3분짜리 클립이 아니라 실제 프로덕션 워크로드를 기준으로 설계되었습니다. 실제로는 다음과 같은 차이를 만듭니다.

Marengo는 벤치마크나 데모, 3분짜리 클립이 아니라 실제 프로덕션 워크로드를 기준으로 설계되었습니다. 실제로는 다음과 같은 차이를 만듭니다.

73%

복합 정확도. Google Vertex 52%, Amazon Nova 55%.

Composite video-retrieval performance

Composite video-retrieval performance

기능

MARENGO 3.0

Gemini Embedding 2

Nova Multimodal embeddings

임베딩 차원

512

3072 (기본값; Matryoshka로 1536 / 768)

3072 (기본값; Matryoshka로 1024 / 384 / 256)

최대 영상 길이

4시간 (연속)

요청당 120초

세그먼트당 30초

멀티모달 복합 쿼리

지원 (이미지+텍스트+오디오 쿼리를 단일 임베딩으로 처리)

네이티브 복합 쿼리 API 없음

네이티브 복합 쿼리 API 없음

스포츠 인식

5개 종목

공식 지원 기능 아님

공식 지원 기능 아님

지연 시간

0.05

~0.50

1.50+

임베딩 신뢰도 점수

지원

미공개

미공개