
商品
TwelveLabs MCPサーバーで、エージェントにビデオインテリジェンスをもたらす

ジェームズ・リー
Twelve Labsは、Claude Desktop、Cursor、WindsurfなどのAIアシスタントが、標準化されたインターフェースを介してビデオ検索、分析、エンベディング機能にアクセスできるようにするMCPサーバーをローンチしました。これにより、カスタムAPIの統合コードを作成することなく、セマンティックビデオ検索、自動要約、およびRAGワークフローが可能になります。
Twelve Labsは、Claude Desktop、Cursor、WindsurfなどのAIアシスタントが、標準化されたインターフェースを介してビデオ検索、分析、エンベディング機能にアクセスできるようにするMCPサーバーをローンチしました。これにより、カスタムAPIの統合コードを作成することなく、セマンティックビデオ検索、自動要約、およびRAGワークフローが可能になります。

この記事の内容
No headings found on page
ニュースレターに登録する
ニュースレターに登録する
ビデオ理解に関する最新の技術進歩、チュートリアル、業界の動向をお届けします
ビデオ理解に関する最新の技術進歩、チュートリアル、業界の動向をお届けします
AIを活用してビデオを検索、分析、探索します。
2025/09/17
7分
記事へのリンクをコピー
動画を視聴して理解できるAIアシスタントが欲しいと思ったことはありませんか?30分のミーティングの録画を数秒で要約できるアシスタントはどうでしょう?あるいは、リクエストに応じて特定の瞬間を見つけるために、何時間もの映像を検索できるアシスタントはいかがですか?新しいTwelveLabs Model Context Protocol (MCP) サーバーを使えば、それが可能になります。
私たちは、私たちの動画理解プラットフォームとAIアシスタントの架け橋となるTwelveLabs MCP サーバーの立ち上げを発表できることを嬉しく思います。これは、オープンなModel Context Protocol標準に基づいて構築されています。このサーバーはユニバーサルアダプターとして機能し、AnthropicのClaudeなどの大規模言語モデル(LLM)エージェントが、TwelveLabsの強力な動画検索および分析機能に直接アクセスできるようにします。実際には、シンプルな自然言語のプロンプトを使用するだけで、お好みのAIアプリケーションが標準化されたインターフェースを介して私たちのツールを呼び出し、動画のインデックス作成、関連プロセスの検索、要約の生成などを行えるようになります。
Claude Desktopアプリ、CursorやWindsurfのようなIDEアシスタント、またはカスタムのAIエージェントのどれを使用していても、TwelveLabs MCPサーバーは統合をスムーズにします。カスタムのAPIコールを書いたり、糊付けコードを作成したりする必要はありません。MCPサーバーを起動して、お使いのAI環境にプラグインするだけです。サーバーは、TwelveLabsの機能を表すリソース、ツール、プロンプトのスイートを公開しているため、MCP互換のクライアントであればどれでも、すぐにそれらを検出して使用できます。(実際、私たちはすでにClaude Desktop、Cursor、Gooseなどの人気クライアントとの互換性を確認済みです)。この投稿では、TwelveLabs MCPサーバーとは何かを説明し、それができるエキサイティングな機能をいくつか紹介し、開始方法をご案内します。
TwelveLabs MCP サーバーとは?
TwelveLabs MCPサーバーは、私たちの動画理解機能(インデックス作成、セマンティック検索、分析、埋め込み)を、標準のMCPツール、リソース、プロンプトとして公開するパッケージサーバーです。これにより、Claude DesktopのようなMCP互換のクライアントであれば、カスタムの糊付けコードを一切なしで使用できるようになります。
使用するには、インストールガイドに従ってサーバーをインストールおよび設定します。接続されると、AIアシスタントは実行時にTwelveLabsのツールを検出して決定論的に呼び出すことができます。例えば、「このライブラリから第4クォーターの3ポイントシュートをすべて検索して」や「この動画を3文で要約して」など、クライアントが理解できる構造化された形式で結果が返されます。

ユースケースと可能性
これにより何ができるようになるでしょうか?簡単に言うと、AIエージェント向けのさまざまな強力な動画理解のユースケースが解放されます。ここでは、TwelveLabs MCPサーバーによって可能になるシナリオのほんの一部をご紹介します:
ツールとしてのセマンティック動画検索:AIエージェントに、「この2時間のウェビナーで発表者が最後のチャートを表示している場所を見つけて」と頼むと、正確なタイムスタンプが返ってくることを想像してみてください。MCPサーバーは、私たちのセマンティック動画検索エンジンを自然言語で呼び出せるツールとして公開します。これにより、すべてのLLMエージェントにとって「動画検索」が最高レベルのアクションとなり、バックグラウンドにある当社のMarengo埋め込みモデルの能力を活用して、説明に一致する瞬間やシーンを動画インデックスから探し出すことができます。
自動動画要約とQ&A:AIアシスタントに、撮影された動画の要約やコンテンツに関する質問への回答をその場で実行させることができます。MCPサーバーは、当社のPegasus動画言語モデルを簡単な呼び出しにラップします。エージェントはこれを呼び出して長時間の動画の簡潔な要約を取得したり、動画IDをプロンプトに入力してQ&Aを実行したりできます。MCPでは動的なコンテキストを持つ構造化されたプロンプトを使用できるため、エージェントは動画のメタデータをリソースとして取得し、より正確な回答を得るためにそれをプロンプトに含めることができます。分かりやすく言えば、AIが動画を「視聴」し、人間と同じように、しかし数秒でそのすべてを教えてくれるのです。
チェーン可能な動画分析(RAGワークフロー):本当の魔法は、ツールを連携(チェーン)させたときに起こります。例えば、エージェントがまず検索ツールを呼び出して(クエリを使用して)関連する動画クリップを取得し、次にそれらのクリップを分析ツールに渡して詳細な回答やレポートを出力することができます。これは本質的に動画のための検索拡張生成(RAG)であり、エージェントが検索と分析を順番に構築します。MCPを使用すると、これらのマルチステップのワークフローがシームレスになります。エージェントはTwelveLabsのツールを正しい順序で自動的に使用するため、「この製品が登場するすべてのシーンを見つけて、それらのシーンのハイライト要約を生成して」といった複雑なタスクを実行できます。これまでAPIの手動コーディングや結合が必要だったことが、MCP対応のAIによって自律的に処理できるようになります。
インタラクティブ動画アシスタント:MCPサーバーはAIアシスタントとリアルタイムで動作するため、真にインタラクティブな動画ワークフローを構築できます。例えば、エージェントがあなたに入力を求めるプロンプトを表示し(「これらのクリップのうち、どれをさらに詳しく調べたいですか?」)、TwelveLabsのツールを介して追加情報を取得し、会話に戻るというようなことができます。ユースケースは、メディアやニュース(最新のニュース動画の要約)から、スポーツ(試合のハイライトの検索とコンパイル)、セキュリティ(イベントの監視カメラ映像の検索)などに及びます。統一されたインターフェースにより、開発者は動画処理の複雑さを心配することなく、気分に合わせたクリップを見つけるパーソナル動画DJエージェントのようなクリエイティブなアイデアを簡単に試すことができます。
Claude Desktopの動作
TwelveLabs MCPサーバーを体験する最もエキサイティングな方法の1つは、Anthropicの強力なチャットベースのAIデスクトップクライアントであるClaude Desktopを使用することです。社内テストでは、Claude Desktopをローカルで実行しているTwelveLabs MCPサーバーに接続したところ、Claudeが瞬時に動画の超能力を手に入れるのを確認できました。
サーバーを起動し、Claude Desktopに接続の詳細を入力すると、アプリは利用可能なツールを自動的に検出しました(MCPのビルトイン検出機能のおかげです)。詳細については、以下のデモ動画をご覧ください。バックグラウンドで、ClaudeはMCPインターフェースを使用してTwelveLabsのツールを呼び出しました。インデックス内の動画のリライティング、セマンティッククエリに基づく特定のクリップの検索、指定された特定の動画のコンテンツ分析などの実行です。

この例は、動画理解をAIワークフローに統合することがいかに簡単になったかを示しています。数回クリックするだけで、Claudeは自然言語を使用して動画を検索および分析する機能を獲得しました。カスタムプラグインも、プロンプトハッキングも不要で、MCPサーバーがギャップを埋めるだけです。また、これはClaudeに限定されません。Cursor(動画データを使用したAI支援コーディング用)や、MCPクライアントSDKを使用する独自のPythonスクリプトなど、他のMCP互換プラットフォームにTwelveLabs MCPサーバーを接続することもできます。ツールが共通のプロトコルで通信できれば、AI + 動画アプリケーションの可能性は無限大です。
TwelveLabs MCPサーバーの始め方
ソースのチェックアウトは不要で、以下の手順に従ってすぐに開始できます:
インストールガイドを開く 👉 https://mcp.twelvelabs.io/try?openInstructions=true。ガイドに沿ってお好みのMCPクライアントにサーバーを追加します。
TwelveLabsのAPIキーを取得する:TwelveLabsアカウントにサインインし、APIキーをコピーします。サーバーがお客様の代わりにTwelveLabsのAPIを安全に呼び出せるよう、セットアップ中にこれを貼り付けます。
MCPクライアントを選択する:ガイドには、クライアント固有の手順(サーバーの追加場所、APIキーの提供方法、ツールの呼び出し承認方法)が記載されています。
接続して確認する:クライアントにTwelveLabs MCPサーバーを追加した後、ツールが表示されていることを確認します。ほとんどのクライアントには、ツールリスト/レジストリUIが表示されます。
最初のワークフローを実行する:いくつかのアイデアについては、以下のWindsurf IDEを使用したデモンストレーションをご覧ください。

1つお伝えしておきたいのは、堅牢なツール呼び出しエラーが、エージェントの自動復旧を支援するということです。プロダクション環境のセットアップには、AlpicのインテリジェントなMCPエラー処理に関するガイドが素晴らしい参考資料となります。
結論と次のステップ
TwelveLabs MCPサーバーのリリースは、AI開発者やプロダクト構築者にとって刺激的な前進です。初めて、APIやカスタムコードをつなぎ合わせるのではなく、単にツールボックスに標準化されたツールを追加するだけで、お使いのAIエージェントに動画コンテンツを認識する目を与えることが容易になりました。これにより、ミーティングの録画を理解できるよりスマートな仮想アシスタントから、動画の文脈をアウトプットにブレンドするクリエイティブなジェネレーティブエージェントまで、マルチモーダルアプリケーションの新しい波が解き放たれると信じています。
言い換えれば、当社のMCPサーバーは、SDKの乱立やカスタム統合コードなしで、動画インテリジェンスをAIワークフロー内の最高クラスの機能にします。これは、すぐに使用できるインストール専用のサーバーとして提供されるため、チームは人気のあるMCPクライアントから数分で接続して構築を開始できます:
メディアとニュース:即時の要約とハイライト
スポーツ:瞬間検索とコンパイル
マーケティング:ロゴ/瞬間の検出とソーシャル対応のカット
👉 今すぐ開始
インストールガイドを使用して、クライアントにTwelveLabs MCPサーバーを追加します。 https://mcp.twelvelabs.io/try?openInstructions=true
APIドキュメントに従ってください: https://docs.twelvelabs.io/docs/advanced/model-context-protocol
独自のMCPサーバーを構築したい開発者の方は、Alpic(無料ベータ版)でホストされたサーバーの起動をご検討ください: https://app.alpic.ai/
動画を視聴して理解できるAIアシスタントが欲しいと思ったことはありませんか?30分のミーティングの録画を数秒で要約できるアシスタントはどうでしょう?あるいは、リクエストに応じて特定の瞬間を見つけるために、何時間もの映像を検索できるアシスタントはいかがですか?新しいTwelveLabs Model Context Protocol (MCP) サーバーを使えば、それが可能になります。
私たちは、私たちの動画理解プラットフォームとAIアシスタントの架け橋となるTwelveLabs MCP サーバーの立ち上げを発表できることを嬉しく思います。これは、オープンなModel Context Protocol標準に基づいて構築されています。このサーバーはユニバーサルアダプターとして機能し、AnthropicのClaudeなどの大規模言語モデル(LLM)エージェントが、TwelveLabsの強力な動画検索および分析機能に直接アクセスできるようにします。実際には、シンプルな自然言語のプロンプトを使用するだけで、お好みのAIアプリケーションが標準化されたインターフェースを介して私たちのツールを呼び出し、動画のインデックス作成、関連プロセスの検索、要約の生成などを行えるようになります。
Claude Desktopアプリ、CursorやWindsurfのようなIDEアシスタント、またはカスタムのAIエージェントのどれを使用していても、TwelveLabs MCPサーバーは統合をスムーズにします。カスタムのAPIコールを書いたり、糊付けコードを作成したりする必要はありません。MCPサーバーを起動して、お使いのAI環境にプラグインするだけです。サーバーは、TwelveLabsの機能を表すリソース、ツール、プロンプトのスイートを公開しているため、MCP互換のクライアントであればどれでも、すぐにそれらを検出して使用できます。(実際、私たちはすでにClaude Desktop、Cursor、Gooseなどの人気クライアントとの互換性を確認済みです)。この投稿では、TwelveLabs MCPサーバーとは何かを説明し、それができるエキサイティングな機能をいくつか紹介し、開始方法をご案内します。
TwelveLabs MCP サーバーとは?
TwelveLabs MCPサーバーは、私たちの動画理解機能(インデックス作成、セマンティック検索、分析、埋め込み)を、標準のMCPツール、リソース、プロンプトとして公開するパッケージサーバーです。これにより、Claude DesktopのようなMCP互換のクライアントであれば、カスタムの糊付けコードを一切なしで使用できるようになります。
使用するには、インストールガイドに従ってサーバーをインストールおよび設定します。接続されると、AIアシスタントは実行時にTwelveLabsのツールを検出して決定論的に呼び出すことができます。例えば、「このライブラリから第4クォーターの3ポイントシュートをすべて検索して」や「この動画を3文で要約して」など、クライアントが理解できる構造化された形式で結果が返されます。

ユースケースと可能性
これにより何ができるようになるでしょうか?簡単に言うと、AIエージェント向けのさまざまな強力な動画理解のユースケースが解放されます。ここでは、TwelveLabs MCPサーバーによって可能になるシナリオのほんの一部をご紹介します:
ツールとしてのセマンティック動画検索:AIエージェントに、「この2時間のウェビナーで発表者が最後のチャートを表示している場所を見つけて」と頼むと、正確なタイムスタンプが返ってくることを想像してみてください。MCPサーバーは、私たちのセマンティック動画検索エンジンを自然言語で呼び出せるツールとして公開します。これにより、すべてのLLMエージェントにとって「動画検索」が最高レベルのアクションとなり、バックグラウンドにある当社のMarengo埋め込みモデルの能力を活用して、説明に一致する瞬間やシーンを動画インデックスから探し出すことができます。
自動動画要約とQ&A:AIアシスタントに、撮影された動画の要約やコンテンツに関する質問への回答をその場で実行させることができます。MCPサーバーは、当社のPegasus動画言語モデルを簡単な呼び出しにラップします。エージェントはこれを呼び出して長時間の動画の簡潔な要約を取得したり、動画IDをプロンプトに入力してQ&Aを実行したりできます。MCPでは動的なコンテキストを持つ構造化されたプロンプトを使用できるため、エージェントは動画のメタデータをリソースとして取得し、より正確な回答を得るためにそれをプロンプトに含めることができます。分かりやすく言えば、AIが動画を「視聴」し、人間と同じように、しかし数秒でそのすべてを教えてくれるのです。
チェーン可能な動画分析(RAGワークフロー):本当の魔法は、ツールを連携(チェーン)させたときに起こります。例えば、エージェントがまず検索ツールを呼び出して(クエリを使用して)関連する動画クリップを取得し、次にそれらのクリップを分析ツールに渡して詳細な回答やレポートを出力することができます。これは本質的に動画のための検索拡張生成(RAG)であり、エージェントが検索と分析を順番に構築します。MCPを使用すると、これらのマルチステップのワークフローがシームレスになります。エージェントはTwelveLabsのツールを正しい順序で自動的に使用するため、「この製品が登場するすべてのシーンを見つけて、それらのシーンのハイライト要約を生成して」といった複雑なタスクを実行できます。これまでAPIの手動コーディングや結合が必要だったことが、MCP対応のAIによって自律的に処理できるようになります。
インタラクティブ動画アシスタント:MCPサーバーはAIアシスタントとリアルタイムで動作するため、真にインタラクティブな動画ワークフローを構築できます。例えば、エージェントがあなたに入力を求めるプロンプトを表示し(「これらのクリップのうち、どれをさらに詳しく調べたいですか?」)、TwelveLabsのツールを介して追加情報を取得し、会話に戻るというようなことができます。ユースケースは、メディアやニュース(最新のニュース動画の要約)から、スポーツ(試合のハイライトの検索とコンパイル)、セキュリティ(イベントの監視カメラ映像の検索)などに及びます。統一されたインターフェースにより、開発者は動画処理の複雑さを心配することなく、気分に合わせたクリップを見つけるパーソナル動画DJエージェントのようなクリエイティブなアイデアを簡単に試すことができます。
Claude Desktopの動作
TwelveLabs MCPサーバーを体験する最もエキサイティングな方法の1つは、Anthropicの強力なチャットベースのAIデスクトップクライアントであるClaude Desktopを使用することです。社内テストでは、Claude Desktopをローカルで実行しているTwelveLabs MCPサーバーに接続したところ、Claudeが瞬時に動画の超能力を手に入れるのを確認できました。
サーバーを起動し、Claude Desktopに接続の詳細を入力すると、アプリは利用可能なツールを自動的に検出しました(MCPのビルトイン検出機能のおかげです)。詳細については、以下のデモ動画をご覧ください。バックグラウンドで、ClaudeはMCPインターフェースを使用してTwelveLabsのツールを呼び出しました。インデックス内の動画のリライティング、セマンティッククエリに基づく特定のクリップの検索、指定された特定の動画のコンテンツ分析などの実行です。

この例は、動画理解をAIワークフローに統合することがいかに簡単になったかを示しています。数回クリックするだけで、Claudeは自然言語を使用して動画を検索および分析する機能を獲得しました。カスタムプラグインも、プロンプトハッキングも不要で、MCPサーバーがギャップを埋めるだけです。また、これはClaudeに限定されません。Cursor(動画データを使用したAI支援コーディング用)や、MCPクライアントSDKを使用する独自のPythonスクリプトなど、他のMCP互換プラットフォームにTwelveLabs MCPサーバーを接続することもできます。ツールが共通のプロトコルで通信できれば、AI + 動画アプリケーションの可能性は無限大です。
TwelveLabs MCPサーバーの始め方
ソースのチェックアウトは不要で、以下の手順に従ってすぐに開始できます:
インストールガイドを開く 👉 https://mcp.twelvelabs.io/try?openInstructions=true。ガイドに沿ってお好みのMCPクライアントにサーバーを追加します。
TwelveLabsのAPIキーを取得する:TwelveLabsアカウントにサインインし、APIキーをコピーします。サーバーがお客様の代わりにTwelveLabsのAPIを安全に呼び出せるよう、セットアップ中にこれを貼り付けます。
MCPクライアントを選択する:ガイドには、クライアント固有の手順(サーバーの追加場所、APIキーの提供方法、ツールの呼び出し承認方法)が記載されています。
接続して確認する:クライアントにTwelveLabs MCPサーバーを追加した後、ツールが表示されていることを確認します。ほとんどのクライアントには、ツールリスト/レジストリUIが表示されます。
最初のワークフローを実行する:いくつかのアイデアについては、以下のWindsurf IDEを使用したデモンストレーションをご覧ください。

1つお伝えしておきたいのは、堅牢なツール呼び出しエラーが、エージェントの自動復旧を支援するということです。プロダクション環境のセットアップには、AlpicのインテリジェントなMCPエラー処理に関するガイドが素晴らしい参考資料となります。
結論と次のステップ
TwelveLabs MCPサーバーのリリースは、AI開発者やプロダクト構築者にとって刺激的な前進です。初めて、APIやカスタムコードをつなぎ合わせるのではなく、単にツールボックスに標準化されたツールを追加するだけで、お使いのAIエージェントに動画コンテンツを認識する目を与えることが容易になりました。これにより、ミーティングの録画を理解できるよりスマートな仮想アシスタントから、動画の文脈をアウトプットにブレンドするクリエイティブなジェネレーティブエージェントまで、マルチモーダルアプリケーションの新しい波が解き放たれると信じています。
言い換えれば、当社のMCPサーバーは、SDKの乱立やカスタム統合コードなしで、動画インテリジェンスをAIワークフロー内の最高クラスの機能にします。これは、すぐに使用できるインストール専用のサーバーとして提供されるため、チームは人気のあるMCPクライアントから数分で接続して構築を開始できます:
メディアとニュース:即時の要約とハイライト
スポーツ:瞬間検索とコンパイル
マーケティング:ロゴ/瞬間の検出とソーシャル対応のカット
👉 今すぐ開始
インストールガイドを使用して、クライアントにTwelveLabs MCPサーバーを追加します。 https://mcp.twelvelabs.io/try?openInstructions=true
APIドキュメントに従ってください: https://docs.twelvelabs.io/docs/advanced/model-context-protocol
独自のMCPサーバーを構築したい開発者の方は、Alpic(無料ベータ版)でホストされたサーバーの起動をご検討ください: https://app.alpic.ai/




