私がチーフサイエンティストとしてTwelve Labsに加わった理由

ソ・ミンジュン

BiDAFネットワークの発明者であり、KAIST AIのLanguage & Knowledge Labのディレクターを務めるミンジュン・ソ（Minjoon Seo）氏が、次世代のマルチモーダルビデオ基盤モデルの進化を牽引するため、チーフサイエンティストとしてTwelve Labsに参画します。

この記事の内容

No headings found on page

ニュースレターに登録する

ビデオ理解に関する最新の技術進歩、チュートリアル、業界の動向をお届けします

AIを活用してビデオを検索、分析、探索します。

プレイグラウンドを試す

2023/02/22

1分

記事へのリンクをコピー

私は常に、世界のすべての知識で強化された知性を持つ機械によって、私たちの生活を豊かにするという概念に魅了されてきました。この魅惑の延長線として、私の研究関心は主に、私たちが蓄積してきたテキストベースの知識にアクセスするためのニューラルインターフェースにありました。私は、既存の情報を検索するためだけでなく、推論を通じて新しい知識を発見するために、言語モデルを膨大な情報プールにどのように接続できるかを探求することにほとんどの時間を費やしています。

次のステップはビデオです。なぜなら、ビデオは私たちが生きる世界、そしてその中にある知識を最も強力に表現するものであると信じているからです。世界から利用可能なテキストデータが急速に枯渇していく中で、次世代の基盤モデルは間違いなくマルチモーダルになり、ビデオに眠る未開拓の情報を活用することになるでしょう。そして、これらのモデルを構築する先駆者たちは、ビデオの取り扱いが極めて困難であるため、計り知れないエンジニアリングと研究の課題を克服しなければなりません。これは、AIの未来に影響を与え、無数の産業を変革するであろう、非常に大胆なビジョンです。

だからこそ、チーフサイエンティストとしてTwelve Labsのチームに加わることができ、大変興奮しています。私は素晴らしい個人や、時にはロックスターばかりのチームに出会うことがよくありますが、技術的に深く、謙虚で、高度に足並みが揃い、そして最も重要なこととして、市場を意識しているチームに出会うことは本当に稀です。私たちは小さく若いチームですが、Twelveのクローズドベータ製品は、他のビデオインテリジェンスAPIよりもすでに顧客から高く支持されています。最近のOCIとの複数年にわたるコンピュートパートナーシップと、チームが蓄積してきた大規模な独自データセットにより、チームがビデオ理解カテゴリーにおいて大きな進歩を遂げることを期待しています。

歴史が何らかの指標になるとすれば、次世代のビデオベースのアプリケーションは最初からインテリジェントである必要があり、Twelve Labsはその信頼できるインフラストラクチャとして戦略的な位置を占めることになるでしょう。科学、エンジニアリング、そしてプロダクトが真に連携したときに、ビデオ基盤モデルによってどれほど素晴らしいことが実現できるかを、私たちのチームと共に示すことを楽しみにしています。

Minjoonについて‍

Minjoonは、KAIST AIの助教授であり、Language & Knowledge Labのディレクターです。彼は双方向アテンションフロー（BiDAF）ネットワークの考案者であり、2019年のFacebookフェローシップおよび2020年のAI2 Lasting Impact Paper Awardの受賞者です。Minjoonはワシントン大学でコンピュータサイエンスの博士号を取得しました。