商品
Marengo 3.0: ビデオインテリジェンスがビデオを戦略的資産に変える

トラヴィス・クチュール
Twelve Labsは、4時間までの動画への対応、50%削減された組み込みデータサイズ、2倍高速なインデックス作成、そして複合マルチモーダル検索やエンティティ検索を含む新機能を備え、Amazon Novaの61.8%やGoogle Vertexの50.2%に対し、78.5%の総合ベンチマークパフォーマンスを達成した動画基盤モデル「Marengo 3.0」をローンチします。
Twelve Labsは、4時間までの動画への対応、50%削減された組み込みデータサイズ、2倍高速なインデックス作成、そして複合マルチモーダル検索やエンティティ検索を含む新機能を備え、Amazon Novaの61.8%やGoogle Vertexの50.2%に対し、78.5%の総合ベンチマークパフォーマンスを達成した動画基盤モデル「Marengo 3.0」をローンチします。

この記事の内容
ニュースレターに登録する
ニュースレターに登録する
ビデオ理解に関する最新の技術進歩、チュートリアル、業界の動向をお届けします
ビデオ理解に関する最新の技術進歩、チュートリアル、業界の動向をお届けします
AIを活用してビデオを検索、分析、探索します。
2025/11/30
5分
記事へのリンクをコピー
動画は世界のデータの90%を占めていますが、その大部分は事実上不可視のままです。Twelve Labsでは、世界最高のビデオインテリジェンスの構築に注力しています。オマケのような動画機能や、画像モデルからフォークされた動画機能ではなく、最も重要な動画ワークロードに対して実際に機能する、動画専用に設計された本番環境グレードのビデオインテリジェンスを提供しています。
本日、私たちは「Marengo 3.0」をリリースします。これは、実世界への導入に対応した本番向けでありながら、極めて高い性能を備えた動画基盤モデルの新たな基準を確立します。
圧倒的な性能差
まず、ほとんどの埋め込み(Embedding)モデルは、実用的な動画ワークロードを処理できません。私たちはMarengo 3.0を、実際に動画を処理できる埋め込みモデル(Amazon NovaおよびGoogle Vertex)と、動画、画像、テキスト、音声の検索にわたる包括的なベンチマークで比較テストしました。その結果は明白です:
Marengo 3.0は、総合的な複合パフォーマンスにおいて、各カテゴリで圧倒的な勝利を収めました。総合性能は78.5%(対してAmazon Novaは61.8%、Google Vertexは50.2%)に達し、動画検索、画像検索、音声検索のすべてにおいて明確なリードを示しています。

モデルを開発するチームが自社に都合の良いデータを抽出して「自社製品が最高だ」と主張するのは簡単です。しかし、本番環境で重要なのは次の点です。「Marengo 3.0が比類のない低遅延で優れたパフォーマンスを提供する一方で、競合他社は処理に失敗するか、極端に動作が遅くなる」ということです。
Amazon Nova: 長尺の動画において10倍〜15倍遅く、4Kコンテンツでは完全にエラーになります
Google Vertex: 60秒を超える動画ではエラーになり、音声もサポートしていません
これは機械学習研究者が議論するための単なる優れたベンチマークデータではありません。本番環境で実用的に機能するモデルと、そうでないモデルの決定的な違いを意味しています。
よりスマートに。より速く。より軽量に。
業界初の機能:
複合マルチモーダル検索(Composed Multimodal Search): 画像とテキストを組み合わせた単一のクエリでの検索
エンティティ検索(Entity Search): 特定の人物やオブジェクトを定義し、それらが特定のアクションを行っているシーンを検索
4時間の動画をサポート: Marengo 2.7の2倍に向上し、競合他社が長尺コンテンツで失敗する中での優れた耐性
50%のストレージ削減: Marengo 2.7の1024次元やNovaの3072次元に対し、本モデルは512次元の埋め込みを採用
2倍高速なインデックス作成: 半分の時間で動画ライブラリの検索を可能に
実世界の動画に特化した設計
他の汎用モデルを流用して動画向けに無理やり組み込んだ競合製品とは異なり、Marengo 3.0は動画を「生きて動く、ダイナミックなシステム」として扱います。ダイアログを理解し、音声を聞き取り、時間の経過に伴う動きを追跡し、何時間にも及ぶコンテンツ全体のコンテキストを把握します。
その確かな証明は、本番環境での実績にあります:
スポーツ・メディア・エンターテインメント: ある顧客企業は、コンテンツ作成時間を数日から数分へと短縮しました
セキュリティ・政府: 機密性の高い、極めて重要な動画データを、正確かつ迅速に認識
広告: 手動での審査を行うことなく、正確なブランドセーフティと文脈に沿った質の高い広告配置を実現
使ってみる
Marengo 3.0は今すぐご利用可能です。何百万もの動画を処理している方でも、動画を活用した最初のアプリケーションを構築している方でも、Marengo 3.0は動画をストレージの負担から戦略的資産へと変身させるための高いインテリジェンスとパフォーマンスを提供します。以下のいずれかで利用を開始してください:
AWS Bedrock: AWSインフラストラクチャとのエンタープライズグレードの統合
TwelveLabs SaaS: PythonおよびNode.js SDKを使用した開発者向けのAPI
さらに詳しく知りたい方は、研究に関するディープな解説を掲載している当社の技術ブログ(英文)をご覧ください。
動画は世界のデータの90%を占めていますが、その大部分は事実上不可視のままです。Twelve Labsでは、世界最高のビデオインテリジェンスの構築に注力しています。オマケのような動画機能や、画像モデルからフォークされた動画機能ではなく、最も重要な動画ワークロードに対して実際に機能する、動画専用に設計された本番環境グレードのビデオインテリジェンスを提供しています。
本日、私たちは「Marengo 3.0」をリリースします。これは、実世界への導入に対応した本番向けでありながら、極めて高い性能を備えた動画基盤モデルの新たな基準を確立します。
圧倒的な性能差
まず、ほとんどの埋め込み(Embedding)モデルは、実用的な動画ワークロードを処理できません。私たちはMarengo 3.0を、実際に動画を処理できる埋め込みモデル(Amazon NovaおよびGoogle Vertex)と、動画、画像、テキスト、音声の検索にわたる包括的なベンチマークで比較テストしました。その結果は明白です:
Marengo 3.0は、総合的な複合パフォーマンスにおいて、各カテゴリで圧倒的な勝利を収めました。総合性能は78.5%(対してAmazon Novaは61.8%、Google Vertexは50.2%)に達し、動画検索、画像検索、音声検索のすべてにおいて明確なリードを示しています。

モデルを開発するチームが自社に都合の良いデータを抽出して「自社製品が最高だ」と主張するのは簡単です。しかし、本番環境で重要なのは次の点です。「Marengo 3.0が比類のない低遅延で優れたパフォーマンスを提供する一方で、競合他社は処理に失敗するか、極端に動作が遅くなる」ということです。
Amazon Nova: 長尺の動画において10倍〜15倍遅く、4Kコンテンツでは完全にエラーになります
Google Vertex: 60秒を超える動画ではエラーになり、音声もサポートしていません
これは機械学習研究者が議論するための単なる優れたベンチマークデータではありません。本番環境で実用的に機能するモデルと、そうでないモデルの決定的な違いを意味しています。
よりスマートに。より速く。より軽量に。
業界初の機能:
複合マルチモーダル検索(Composed Multimodal Search): 画像とテキストを組み合わせた単一のクエリでの検索
エンティティ検索(Entity Search): 特定の人物やオブジェクトを定義し、それらが特定のアクションを行っているシーンを検索
4時間の動画をサポート: Marengo 2.7の2倍に向上し、競合他社が長尺コンテンツで失敗する中での優れた耐性
50%のストレージ削減: Marengo 2.7の1024次元やNovaの3072次元に対し、本モデルは512次元の埋め込みを採用
2倍高速なインデックス作成: 半分の時間で動画ライブラリの検索を可能に
実世界の動画に特化した設計
他の汎用モデルを流用して動画向けに無理やり組み込んだ競合製品とは異なり、Marengo 3.0は動画を「生きて動く、ダイナミックなシステム」として扱います。ダイアログを理解し、音声を聞き取り、時間の経過に伴う動きを追跡し、何時間にも及ぶコンテンツ全体のコンテキストを把握します。
その確かな証明は、本番環境での実績にあります:
スポーツ・メディア・エンターテインメント: ある顧客企業は、コンテンツ作成時間を数日から数分へと短縮しました
セキュリティ・政府: 機密性の高い、極めて重要な動画データを、正確かつ迅速に認識
広告: 手動での審査を行うことなく、正確なブランドセーフティと文脈に沿った質の高い広告配置を実現
使ってみる
Marengo 3.0は今すぐご利用可能です。何百万もの動画を処理している方でも、動画を活用した最初のアプリケーションを構築している方でも、Marengo 3.0は動画をストレージの負担から戦略的資産へと変身させるための高いインテリジェンスとパフォーマンスを提供します。以下のいずれかで利用を開始してください:
AWS Bedrock: AWSインフラストラクチャとのエンタープライズグレードの統合
TwelveLabs SaaS: PythonおよびNode.js SDKを使用した開発者向けのAPI
さらに詳しく知りたい方は、研究に関するディープな解説を掲載している当社の技術ブログ(英文)をご覧ください。




