ケーススタディ
TwelveLabsとユニセフ韓国委員会 —
8TBの活動現場の映像・写真、
一瞬で検索可能に。
チャレンジ
ユニセフ韓国委員会は、数十年にわたる資金調達キャンペーンや子供の権利プログラムを通じて蓄積された、8TBを超えるメディアを保有しています。これには、数十カ国における救援活動、寄付者イベント、非営利事業などに及ぶ、数万時間ものビデオと数百万枚の画像が含まれています。
その価値にもかかわらず、このアーカイブの大部分はアクセスできない状態が続いていました。コンテンツは個々のPCやネットワークストレージシステムに分散しており、検索や取り出しを行う統一された方法はありませんでした。特定のクリップを見つけるには、手作業で何千ものフォルダを確認せねばならないことも多く、ファイル名からその内容を把握することは困難でした。最長で10年もの間、埋もれていた映像は活用されないままでした。それは価値がなかったからではなく、単に探し出すのに時間がかかりすぎたからです。
チームは、このコンテンツを検索可能にする方法を必要としていました。単に技術的にインデックスを作成するだけでなく、実際にそれを使用する人々、つまりファイルパスではなくシーンやストーリーで考える広報やキャンペーンの担当スタッフが、実際に検索できるようにする必要があったのです。
エラーの原因
従来のアプローチの限界
アーカイブ管理の標準的なアプローチは、この種のコンテンツにおいて限界に直面します。
8TB規模での手動によるカタログ作成は現実的ではありません。これには数ヶ月に及ぶ専任のリソースが必要であり、新しく追加されるコンテンツはすぐにアーカイブの対象外になってしまいます。
キーワードベースの検索は、ビジュアルコンテンツに対しては機能しません。ファイル名やタグだけでは、シーン内で何が起きているかを捉えることは困難です。「南スーダンで水源の近くで子供を抱く母親」という映像を、ファイル名だけで見つけ出すことはできません。
フレーム単位のAIツールは、ビデオを断片的な画像の集まりとして処理するため、映像に意味を与える文脈や時間的な関係性を見落としてしまいます。
このアーカイブには、フレーム内にどのようなピクセルが表示されているかだけでなく、ビデオの中で「何が起きているか」を理解できるシステムが必要でした。
Twelve Labsが選ばれる理由
TwelveLabsは、映像コンテンツ、動き、音声、そして時間的関係性を統合的に分析することで、動画を一つの統合されたメディアとして捉えるという、異なるアプローチを採用しています。これを支えるのが、主に次の2つの革新的なコアモデルです。
マレンゴ
エンコーダー。ビデオ、オーディオ、画像、テキストを共有のマルチモーダル埋め込み(embeddings)に圧縮し、すべてのコンテンツタイプにわたる同時セマンティック検索を可能にします。
ペガサス
推論モデル。動画の特定の部分(フレーム)だけでなく、全体の流れを通じて、そこで何が起きているのかを理解し、イベントを特定します。
非営利のアーカイブにとって、このアーキテクチャは非常に重要です。現地の映像素材が整理されていたり、ラベルが貼られていたりすることはほとんどありません。「ワクチンを接種する子どもたち」や「水害の救援物資分配」といった検索は、ファイル名が未設定でメタデータが存在せず、さらには該当する場面が長い動画クリップの中のわずか数秒間であっても機能する必要があります。TwelveLabsは、まさにこのような検索を可能にします。
このソリューションは、韓国のAIインテグレーションパートナーであるLetsurによってTwelveLabsのAPIを使用して構築され、本番環境対応のアーカイブシステムとしてユニセフ韓国委員会に提供されました。
Twelve Labsのビデオ理解技術の実装
アーカイブシステムの仕組み:
1
個人のPCやNASドライブに保存されていた既存のコンテンツがAWS S3に移行され、一元管理されたスケーラブルな基盤が構築されました。TwelveLabsは、約200時間・2TBの動画、およびそれに関連する画像やドキュメントを含むアーカイブ全体をインデックス化し、すべてのコンテンツに対してマルチモーダル埋め込み(マルチモーダル・エンベディング)を生成しました。
2
自然言語検索
スタッフは、シーンや状況、被写体を日常の言葉で表現するという、自分の思考に沿った方法でアーカイブを検索できるようになりました。「アフリカの現地で子どもたちが水を汲んでいる様子」や「年末の資金調達キャンペーンのクリップ」といったクエリを入力すると、関連するクリップや画像、ドキュメントが、正確なタイムスタンプとともに瞬時に表示されます。
3
自動取り込み
現地活動、救済支援、グローバルミッションなどから得られる新しいコンテンツは、システムに組み込まれると同時に自動的にインデックスに登録されます。手作業による分類ステップは必要ありません。すべての新しい動画、写真、文書は、同じ自然言語インターフェースを通じてすぐに検索可能です。
1
寄付者コミュニケーション
広報担当者は、特定のドナーのストーリーに関連するField写真や映像を数秒で見つけることができます。以前は複数のドライブを手動で探索する必要がありましたが、今ではすぐに見つかるため、スタッフは本来のコミュニケーション業務に時間を充てることができます。
2
キャンペーン計画とコンテンツ開発
過去のキャンペーン素材の検索と参照がより簡単になりました。新しいキャンペーンを計画するチームは、過去の制作物から関連する映像や画像をすばやく見つけ出すことができるため、コンテンツ開発の初期段階における素材探しの時間を大幅に短縮できます。
3
継続的な現地ドキュメンテーション
ワクチン接種キャンペーンや緊急援助活動から、長期的な開発プログラムに至るまで、現場のチームは継続的にドキュメントを作成しています。これらの資料はすべて、手作業によるタグ付けや分類を行うことなく、自動的にインデックス化され、検索可能になります。
3
歴史的アーカイブへのアクセスの向上
最長で10年間埋もれていた映像が、検索によってより簡単に見つけられるようになります。現場の映像、キャンペーン素材、支援活動の記録など、長年にわたる記録文書へのアクセスが容易になり、関連性がある場合に再利用しやすくなりました。
インパクト
デプロイの効果は測定可能であり、即座に現れます。
コンテンツ検索時間を95%削減 — 手動でのフォルダー検索から、自然言語による数秒での検索結果取得へ。
フラグメント化された8TB以上のデータを、構造化され検索可能なデジタルアセットライブラリへと変換。
何千もの手作業によるフォルダー確認が不要になり、キャンペーン計画やコンテンツ制作のワークフローが劇的にスピードアップしました。
約200時間、容量にして2TB分におよぶビデオがインデックス化され、全スタッフが即座にアクセスできるようになりました。
新しいコンテンツに手動での分類は一切不要です。新しい素材が追加されると、アーカイブは自動的に更新されます。
定量的な成果だけでなく、組織的な価値が深まったことこそが真の強みです。ユニセフ韓国委員会は、組織としての共有データ(インスティテューショナル・メモリー)を確立しました。これにより、広報やキャンペーンの担当チームは、コンテンツの検索ではなく、ストーリーテリング、ドナーとのエンゲージメント、キャンペーン戦略といった真に重要な業務に時間を割くことができるようになりました。




