「AGIへの道」飛書ナレッジベースへ直行 →

バイオメトリクス

シェア
開く
フルスタックの自己研究、テキスト、画像、3D、ビデオ、その他のマルチモーダル情報の融合
🖼️ イメージ
📺 ビデオ

概要

(BioCount」)は2023年3月に設立され、清華大学人工知能研究所出身のコアチームメンバーに加え、Ali、Tencent、bytesなどの有名テクノロジー企業から優秀な人材を集め、革新的な研究開発能力の基礎となる拡散と確率モデルを備えた世界有数の深層生成アルゴリズム研究チームです。世界をリードする深層生成アルゴリズム研究チームであり、革新的な研究開発能力の根底には確率モデルの拡散がある。同社は、テキスト、画像、ビデオ、3D、その他のマルチモーダル情報を融合し、アートデザイン、ゲーム制作、映画やテレビのポストプロダクション、コンテンツソーシャルネットワーキング、その他のシナリオにおけるジェネレーティブAIの商業的エンパワーメントを探求し、AIを通じて人間の創造性と生産性を高める、世界有数のマルチモーダルラージモデルの構築に取り組んでいる。

主な製品は、ビジュアルクリエイティブデザインプラットフォームのPixWeaver、3Dアセット作成ツールのVoxCraftなどである。

CEOのTang Jiayuはインタビューで次のように述べている。まず、マルチモダリティの重要性が確認されました。私たちのチームは常にマルチモーダルの方向性を堅持しており、早くも昨年、画像、3Dモデル、動画のマルチモーダル生成の基本を網羅した大型モデルを発表しました。私たちは当初から、モノリンガルモデルには限界があり、マルチモーダリティは情報の種類を豊かにし、モデルの能力の上限を引き上げ、人間が世界を経験する方法によりマッチさせることができることに気づいていました。

第二に、技術面では、私たちは初日からSoraと同じ拡散+トランスフォーマーのアーキテクチャを選択し、「ネイティブ」なマルチモーダル路線にこだわった。もちろん、業界がマルチモーダル技術の探求を止めたわけではなく、さまざまなルートでまだ多くの研究が行われていますが、Soraのリリースは、マルチモーダル世代におけるディフュージョン・トランスフォーマー・ルートの大きな可能性を業界に如実に示しました。

関連する推奨