미디어·엔터테인먼트

원본 영상을 구조화된 데이터로 전환하세요

화자 전환, 브랜드 노출, 플레이, 정책 위반 같은 핵심 이벤트를 정의하고, 단 한 번의 API 호출로 시간 코드가 포함된 JSON을 반환하는 영상-텍스트 모델입니다.

화자 전환, 브랜드 노출, 플레이, 정책 위반 같은 핵심 이벤트를 정의하고, 단 한 번의 API 호출로 시간 코드가 포함된 JSON을 반환하는 영상-텍스트 모델입니다.

2시간

전체 시간 맥락을 끝까지 유지하면서 처리 가능한 최대 영상 길이.

12

입력 프롬프트와 생성 출력에서 모두 지원하는 언어 수.

0

사전 인덱싱 불필요. URL, 에셋, Base64를 전송하면 바로 텍스트 결과를 받을 수 있습니다.

JSON

편집 도구나 파이프라인에 바로 연결할 수 있는 구조화된 세그먼트 출력.

Pegasus만이 할 수 있는 일

대형 언어 모델(LLM)이 텍스트를 연산 가능한 데이터로 만들었듯, 트웰브랩스는 비디오, 이미지, 오디오를 연산 가능하게 만듭니다. 단순한 검색을 넘어 분석과 실행까지 가능하게 합니다.

대형 언어 모델(LLM)이 텍스트를 연산 가능한 데이터로 만들었듯, 트웰브랩스는 비디오, 이미지, 오디오를 연산 가능하게 만듭니다. 단순한 검색을 넘어 분석과 실행까지 가능하게 합니다.

타임스탬프가 포함된 정확한 답변.

Pegasus는 '대략적인 중간 지점'이 아닌 정확한 타임스탬프를 제공합니다. 정교한 시간 추론 능력이 모델에 내장되어 있습니다.

디테일까지 놓치지 않는 정밀한 분석.

화면 속 텍스트, 유니폼 등번호, 화이트보드, 영수증까지 파악합니다. Pegasus는 영상 프레임을 음성 트랙과 함께 해석해, 요약 결과물에 발표 슬라이드 내용까지도 누락 없이 포함됩니다.

원본 영상에서 구조화된 JSON까지.

화자 변경, 브랜드 노출, 화면 전환 등 원하는 기준을 설정하세요. Pegasus가 타임스탬프가 포함된 정밀한 JSON을 반환합니다.

이미지를 시각적 프롬프트로 활용하세요.

로고, 인물, 제품 등의 레퍼런스 이미지를 입력하면 Pegasus가 이를 시각적 맥락으로 즉각 활용합니다.

가입에서 첫 결과까지, 단 5분.

동일한 모델, 동일한 프롬프트, 동일한 JSON 출력. 팀에 맞는 인터페이스를 선택하세요.

동일한 모델, 동일한 프롬프트, 동일한 JSON 출력. 팀에 맞는 인터페이스를 선택하세요.

Python
Node.js
1import requests
2 
3# Step 2: Define the API URL and the specific endpoint
4API_URL = "https://api.twelvelabs.io/v1.3"
5INDEXES_URL = f"{API_URL}/indexes"
6 
7# Step 3: Create the necessary headers for authentication
8headers = {
9 "x-api-key": "<YOUR_API_KEY>"
10}
11 
12# Step 4: Prepare the data payload for your API request
13INDEX_NAME = "<YOUR_INDEX_NAME>"
14data = {
15 "models": [
16 {
17 "model_name": "marengo3.0",
18 "model_options": ["visual", "audio"]
19 }
20 ]
21}

Quick Start

첫 영상을 인덱싱하고, 5분 안에 검색까지 실행해보세요.

샘플 앱

프로덕션용 레포: 영상 검색, 영상 기반 RAG, 하이라이트 릴 생성기, 컴플라이언스 스캐너.

MCP Server

Claude, Cursor 등 모든 MCP 클라이언트를 영상 인덱스에 손쉽게 연동하세요.

SDK 및 API

Python, Node, REST 완벽 지원. 상세한 API 레퍼런스와 타입 기반 응답, 스트리밍 기능까지 제공합니다.

Quick Start

첫 영상을 인덱싱하고, 5분 안에 검색까지 실행해보세요.

샘플 앱

프로덕션용 레포: 영상 검색, 영상 기반 RAG, 하이라이트 릴 생성기, 컴플라이언스 스캐너.

MCP Server

Claude, Cursor 등 모든 MCP 클라이언트를 영상 인덱스에 손쉽게 연동하세요.

SDK 및 API

Python, Node, REST 완벽 지원. 상세한 API 레퍼런스와 타입 기반 응답, 스트리밍 기능까지 제공합니다.

단편적인 프레임이 아닌, 영상의 맥락을 읽어내는 진짜 AI.

범용 멀티모달 LLM은 영상을 몇 개의 장면과 캡션으로 나누어 처리합니다. Pegasus는 모든 프레임과 모달리티, 순간의 흐름까지 아우르며 영상 전체를 이해합니다.

범용 멀티모달 LLM은 영상을 몇 개의 장면과 캡션으로 나누어 처리합니다. Pegasus는 모든 프레임과 모달리티, 순간의 흐름까지 아우르며 영상 전체를 이해합니다.

7,200초

단 하나의 프롬프트로 최대 2시간의 연속된 영상을 한 번에 분석합니다.

Practical max video length handled in a single call.

Practical max video length handled in a single call.

기능

PEGASUS 1.5

Gemini 3.1 PRO

GPT-5.5

단일 API 호출 최대 처리 한도

120분

90분

명시되지 않음(옴니모달, 공개된 영상 길이 제한 없음)

구조화된 세그먼트 출력

JSON 네이티브, 스키마 기반

Structured Outputs 지원, 네이티브 시간 구간 분할 없음

Structured Outputs 지원, 네이티브 시간 구간 분할 없음

멀티모달 프롬프팅 (이미지+텍스트)

지원 (구조화된 세그먼트 출력 내)

지원 (Gemini 3.x의 대표 OCR 기능)

지원 (옴니모달 OCR 지원)

정의별 타임 윈도우

지원

범용 프론티어 모델

범용 옴니모달 모델