プラットフォーム

価格

ソリューション

構築

資料

会社

Select Language

Playground

営業担当に相談する

Search and Understand Your Videos - with AI

Find anything, discover deep insights, analyze, remix and automate workflows with AI that can see, hear, and reason across your entire video content.

Schedule a Demo

Try the Playground

Schedule a Demo

Try the Playground

導入企業

人間並みの理解力。人間の限界を超える成果のために。

これまでに体験したどの技術をも上回る、セマンティック検索と動画のテキスト化機能を体感してください。動画特化型AIが、その違いを生み出します。

検索

Find specific moments within your videos by describing the scene in natural language.

Analyze

Generate text from videos - summary, chapters, highlights and more.

Embed

Build your own classifier using
natural language and run instantly.

Build your own classifier using natural language and run instantly.

世界トップクラスの精度。

TwelveLabsの動画特化型AIは、主要クラウドベンダーやオープンソースモデルのベンチマークを上回る。

圧倒的なスケール。

Our powerful infrastructure handles the largest video libraries – even petabytes of data.

フルカスタマイズに対応。

TwelveLabsのモデルは、お客様のデータで簡単に学習させることができ、専門分野のエキスパートへと進化。

どこにでもデプロイ可能。

クラウド、プライベートクラウド、オンプレミスのいずれでも、必要な環境に安全かつ簡単に導入できます。

世界トップクラスの精度。

TwelveLabsの動画特化型AIは、主要クラウドベンダーやオープンソースモデルのベンチマークを上回る。

圧倒的なスケール。

Our powerful infrastructure handles the largest video libraries – even petabytes of data.

フルカスタマイズに対応。

TwelveLabsのモデルは、お客様のデータで簡単に学習させることができ、専門分野のエキスパートへと進化。

どこにでもデプロイ可能。

クラウド、プライベートクラウド、オンプレミスのいずれでも、必要な環境に安全かつ簡単に導入できます。

世界トップクラスの精度。

TwelveLabsの動画特化型AIは、主要クラウドベンダーやオープンソースモデルのベンチマークを上回る。

圧倒的なスケール。

Our powerful infrastructure handles the largest video libraries – even petabytes of data.

フルカスタマイズに対応。

TwelveLabsのモデルは、お客様のデータで簡単に学習させることができ、専門分野のエキスパートへと進化。

どこにでもデプロイ可能。

クラウド、プライベートクラウド、オンプレミスのいずれでも、必要な環境に安全かつ簡単に導入できます。

フルカスタマイズに対応。

TwelveLabsのモデルは、お客様のデータで簡単に学習させることができ、専門分野のエキスパートへと進化。

どこにでもデプロイ可能。

クラウド、プライベートクラウド、オンプレミスのいずれでも、必要な環境に安全かつ簡単に導入できます。

TOP USES

Tailored for your industry.

Media & Entertainment

Govt. & Security

自動車

自動クリップ生成

長時間の動画から、ソーシャルメディアやマーケティングに活用できるショートクリップを瞬時に作成します。

シーン選択

重要なシーンを素早く検索し、分類。ベストなテイクを選び抜き、ハイライトシーンを簡単にまとめることができます。

NG集＆舞台裏コンテンツ

メイキングや舞台裏などの特別映像から、最高に魅力的なシーンを自動でまとめたハイライトリールを作成します。

自動タグ付け

手作業によるタグ付けは一切不要。膨大な動画ライブラリのコンテンツへ簡単にアクセスし、効率的に管理できます。

コンテンツ要約

高品質な要約文や見出しを生成し、動画のコアメッセージを視聴者へ即座に伝えます。

コンテンツディスカバリ

— 映像内の重要な瞬間をすぐに見つけ出します。また、顧客自身が目的のシーンを発見しやすくなるようサポートします。

リアルタイムシーン分類

ワークフローの途中で編集サポートを提供し、シームレスで迅速な映像制作を実現します。

広告マッチング

動画の文脈に合わせた最適な広告配置を行い、顧客の注目度とエンゲージメントを確実に高めます。

TOP USES

Tailored for your industry.

Media & Entertainment

Govt. & Security

自動車

自動クリップ生成

長時間の動画から、ソーシャルメディアやマーケティングに活用できるショートクリップを瞬時に作成します。

シーン選択

重要なシーンを素早く検索し、分類。ベストなテイクを選び抜き、ハイライトシーンを簡単にまとめることができます。

NG集＆舞台裏コンテンツ

メイキングや舞台裏などの特別映像から、最高に魅力的なシーンを自動でまとめたハイライトリールを作成します。

自動タグ付け

手作業によるタグ付けは一切不要。膨大な動画ライブラリのコンテンツへ簡単にアクセスし、効率的に管理できます。

コンテンツディスカバリ

— 映像内の重要な瞬間をすぐに見つけ出します。また、顧客自身が目的のシーンを発見しやすくなるようサポートします。

コンテンツ要約

高品質な要約文や見出しを生成し、動画のコアメッセージを視聴者へ即座に伝えます。

リアルタイムシーン分類

ワークフローの途中で編集サポートを提供し、シームレスで迅速な映像制作を実現します。

広告マッチング

動画の文脈に合わせた最適な広告配置を行い、顧客の注目度とエンゲージメントを確実に高めます。

TOP USES

Tailored for your industry.

Media & Entertainment

Govt. & Security

自動車

自動クリップ生成

長時間の動画から、ソーシャルメディアやマーケティングに活用できるショートクリップを瞬時に作成します。

シーン選択

重要なシーンを素早く検索し、分類。ベストなテイクを選び抜き、ハイライトシーンを簡単にまとめることができます。

NG集＆舞台裏コンテンツ

メイキングや舞台裏などの特別映像から、最高に魅力的なシーンを自動でまとめたハイライトリールを作成します。

自動タグ付け

手作業によるタグ付けは一切不要。膨大な動画ライブラリのコンテンツへ簡単にアクセスし、効率的に管理できます。

コンテンツ要約

高品質な要約文や見出しを生成し、動画のコアメッセージを視聴者へ即座に伝えます。

コンテンツディスカバリ

— 映像内の重要な瞬間をすぐに見つけ出します。また、顧客自身が目的のシーンを発見しやすくなるようサポートします。

リアルタイムシーン分類

ワークフローの途中で編集サポートを提供し、シームレスで迅速な映像制作を実現します。

広告マッチング

動画の文脈に合わせた最適な広告配置を行い、顧客の注目度とエンゲージメントを確実に高めます。

当社のモデルラインアップ。

These state-of-the-art video foundation models are setting the standard for video intelligence.

私たちTwelveLabsは、人間と同レベルの推論力で課題を解決する「動画特化型AIシステム」を開発しています。AI がこの世界について学習するのをサポートし、人々が映像のストーリーをより的確に検索・抽出して、魅力的に発信できるよう支援します。

Marengo 3.0

Sets new benchmarks in zero-shot text-to-video, text-to-image, and text-to-audio retrieval tasks with a single embedding model.

Outperforms Google's VideoPrism-G model by +10% on the MSR-VTT dataset and +3% on the ActivityNet dataset

Surpasses the SOTA image foundation model in zero-shot text-to-image retrieval tasks, showcasing its ability to understand and process visual content.

Pegasus 1.2

Processes the video input to generate rich embeddings from both video frames and audio speech recognition (ASR) data.

Maps the video embeddings to corresponding language embeddings, creating a shared space where video and text representations are aligned.

The large language model decoder takes the aligned embeddings and user prompts to generate coherent and contextually relevant text output.

Ready to see your video differently?

Try your own video in our Playground to see next-level intelligence in action.

営業担当に相談する

Try on Playground

営業担当に相談する

Try on Playground

Ready to see your video differently?

Try your own video in our Playground to see next-level intelligence in action.

営業担当に相談する

Try on Playground

営業担当に相談する

Try on Playground

Ready to see your video differently?

Try your own video in our Playground to see next-level intelligence in action.

営業担当に相談する

Try on Playground

営業担当に相談する

Try on Playground

プラットフォーム

Enterprise

Developers

Capabilities

ソリューション

Media & Entertainment

会社

Social

2026年

プラットフォーム

Enterprise

Developers

Capabilities

ソリューション

Media & Entertainment

会社

Social

2026年

プラットフォーム

Enterprise

Developers

Capabilities

ソリューション

Media & Entertainment

会社

Social

2026年