合同会社JoyPix
表情・背景・音声がさらにリアルに。実写・動物・アニメキャラまで自在にしゃべるAIモデルが、最大120秒の動画生成にも対応

AIによるコンテンツ制作ツールを提供する合同会社JoyPix(本社:東京都江東区)は、写真に動きと音声を加えることで命を吹き込むAI技術をさらに進化させた最新モデル「Motion-2™(モーション・ツー)」を、正式にリリースしました。
サービスURL:https://www.joypix.ai/app/talking-avatar/
■「Motion-2」とは
JoyPixが開発した「Motion-2」は、静止画像に音声や動きを加えることで、表情や口の動き、背景描写までを自然に再現し、まるで被写体が実際に話しているかのような動画を生成できるAIモデルです。
従来のAIモデルで課題となっていた不自然な口の動きや背景の不整合を大幅に改善し、より自然で滑らかな動きに加えて、長時間の動画生成も可能になりました。これにより、個人利用からビジネス用途に至るまで、さまざまなシーンでの活用が期待されています。
■「Motion-2」アップデートのハイライト
今回のアップデートでは、主に5つの点で飛躍的な性能向上を実現しました。
(1)「フルシンク」で表情や口の動き、動作までが圧倒的に自然に
独自のAIアルゴリズムにより、音声と顔の微細な動きを精密に同期。まばたきや首の傾き、感情を帯びた表情など、人間特有の「仕草」を自動生成し、かつてない自然さを実現しました。
さらに、手や体の動きまで音声に連動させる「フルシンク」により、全身での表現が可能に。表現力が飛躍的に向上し、まるで本人が語りかけてくるかのようなリアルさを提供します。
(2)背景も動く!複雑なシーンにも対応
人物だけでなく、画像の背景もAIが認識し、人物の動きに連動して背景が自然に揺れ動くことで、動画全体の没入感が格段に向上しました。これにより、屋内外を問わず、あらゆるシーンで違和感のない動画を作成できます。
(3)アニメイラストも完璧に対応
実写の人物や動物だけでなく、アニメやイラストといった2Dキャラクターにも完全対応。キャラクターの画風や個性を保ったまま、生き生きとした表情で喋らせることができ、VTuberやゲームキャラクター制作などにも最適です。
(4)動物もリアルに「話す」
ユーザーから多くの要望が寄せられていた、動物写真への対応を強化しました。犬や猫などのペットの写真でも、音声に合わせて口元が自然に動く「リップシンク」が可能となり、まるでペットが飼い主に語りかけているような動画を生成できます。心温まるコンテンツや、ユニークで楽しいSNS投稿など、クリエイティビティの幅が無限に広がります。
(5)動画の生成可能時間が最大120秒に
生成可能な動画の最大長を、従来の45秒から120秒へと大幅に延長しました。これにより、短いメッセージだけでなく、製品紹介やプレゼンテーション、教育コンテンツなど、より長く詳細な情報を伝える動画コンテンツの制作にも十分に対応できるようになりました。
■「Motion-2」の活用シーン
企業のマーケティング担当者様:
静止画の広告素材を、語りかける動画広告として再活用。
プレゼンターのアバターを作成し、ウェビナーや製品紹介動画を効率的に制作。
SNSクリエイターの皆様:
歴史上の人物や絵画を喋らせる、教育系・エンタメ系コンテンツの作成。
愛するペットが歌ったり話したりする、バズる動画の制作。
個人の皆様:
昔の思い出の写真を動かし、家族の歴史を感動的な動画に。
家族や友人の写真を喋らせ、特別なお祝いのメッセージを作成。
■今後の展望
JoyPixは、「誰もがクリエイターになれる世界」の実現を目指し、今後もAI技術を活用した革新的なサービスの開発に取り組んでまいります。
「Motion-2」についても、さらなる長時間対応、多言語対応、リアルタイム生成機能の実装を視野に入れ、引き続き研究開発を進めてまいります。今後の展開にどうぞご期待ください。
■合同会社JoyPixについて
合同会社JoyPixは、「AIで、創造に喜びを」をミッションに掲げるテクノロジースタートアップです。AIアバター、AI動画生成をはじめとする最先端のAI技術を駆使し、世界中の人々のクリエイティビティを解放するサービスを提供しています。
公式サイト: https://www.joypix.ai/ja/

※「Motion-2」は、合同会社JoyPixの商標または登録商標です。