モデルマーケット
検索、フィルタ、Playground の起動をひとつの流れで。
機能
入力タイプ
価格帯 ($)
無料トライアル
初心者向けのモデルのみ表示
最近追加されたモデル

grok
Grok Imagine Video
Grok Imagine Video は、テキストから動画・画像から動画のワークフローに対応した、ホスト型の Grok 動画生成モデルです。

vidu
Vidu Q3 Pro
Vidu Q3 Proは、ハイエンドなテキストからビデオ(Text-to-Video)および画像からビデオ(Image-to-Video)の生成に対応したViduの高度なAIビデオモデルです。最大16秒の1080pクリップを生成でき、ネイティブな同期オーディオ、精密なカメラ制御、そして広告、アニメーション、映画のような短編コンテンツに適した強力なストーリーテリング品質を備えています。
vidu
Vidu Q3 Turbo
Vidu Q3 Turboは、速度を重視したVidu Q3ビデオモデルのバージョンです。同期されたオーディオを含む高速なテキストからビデオ(T2V)および画像からビデオ(I2V)の生成、短尺クリップの作成、そして迅速なターンアラウンドを求めるクリエイター向けのレスポンシブなイテレーションを実現するために構築されています。

seedance
Seedance 2.0
Seedance 2.0は、ByteDanceによって開発されたマルチモーダルAIビデオモデルです。従来の「テキストからビデオ」に限定されたモデルとは異なり、Seedance 2.0ではテキスト、画像、ビデオ、オーディオをリファレンス入力として組み合わせることができ、より高度な制御と豊かなディテールを備えたコンテンツ生成が可能です。その発表は大きな注目を集めています。公式発表によると、著作権リスクへの懸念からSeedance 2.0 APIのリリースは延期されましたが、内部情報では2026年3月中旬から下旬にかけて一般公開が予定されています。 ModelHunter AIは、Seedance 2.0 APIを統合する最初のプラットフォームの一つとなります。ウェイトリストへの登録は [email protected] までメールでお問い合わせください。

seedance
Seedance 1.5 Pro
Seedance 1.5 Proは、複雑なプロンプトを高い精度で実行するために構築されたByteDanceの音声・映像統合生成モデルです。ネイティブな同期オーディオ、強力な多言語リップシンク、映画級のシネマティックなモーションを組み合わせ、より没入感のあるテキストからビデオ(T2V)および画像からビデオ(I2V)の制作を可能にします。
人気のモデル
すべてのモデル

grok
Grok Imagine Video
Grok Imagine Video は、テキストから動画・画像から動画のワークフローに対応した、ホスト型の Grok 動画生成モデルです。

vidu
Vidu Q3 Pro
Vidu Q3 Proは、ハイエンドなテキストからビデオ(Text-to-Video)および画像からビデオ(Image-to-Video)の生成に対応したViduの高度なAIビデオモデルです。最大16秒の1080pクリップを生成でき、ネイティブな同期オーディオ、精密なカメラ制御、そして広告、アニメーション、映画のような短編コンテンツに適した強力なストーリーテリング品質を備えています。
vidu
Vidu Q3 Turbo
Vidu Q3 Turboは、速度を重視したVidu Q3ビデオモデルのバージョンです。同期されたオーディオを含む高速なテキストからビデオ(T2V)および画像からビデオ(I2V)の生成、短尺クリップの作成、そして迅速なターンアラウンドを求めるクリエイター向けのレスポンシブなイテレーションを実現するために構築されています。

seedance
Seedance 2.0
Seedance 2.0は、ByteDanceによって開発されたマルチモーダルAIビデオモデルです。従来の「テキストからビデオ」に限定されたモデルとは異なり、Seedance 2.0ではテキスト、画像、ビデオ、オーディオをリファレンス入力として組み合わせることができ、より高度な制御と豊かなディテールを備えたコンテンツ生成が可能です。その発表は大きな注目を集めています。公式発表によると、著作権リスクへの懸念からSeedance 2.0 APIのリリースは延期されましたが、内部情報では2026年3月中旬から下旬にかけて一般公開が予定されています。 ModelHunter AIは、Seedance 2.0 APIを統合する最初のプラットフォームの一つとなります。ウェイトリストへの登録は [email protected] までメールでお問い合わせください。

seedance
Seedance 1.5 Pro
Seedance 1.5 Proは、複雑なプロンプトを高い精度で実行するために構築されたByteDanceの音声・映像統合生成モデルです。ネイティブな同期オーディオ、強力な多言語リップシンク、映画級のシネマティックなモーションを組み合わせ、より没入感のあるテキストからビデオ(T2V)および画像からビデオ(I2V)の制作を可能にします。

seedance
Seedance 1.0 Pro
Seedance 1.0 Proは、テキストからビデオ(Text-to-Video)および画像からビデオ(Image-to-Video)を生成するために設計されたByteDanceの高度なビデオ生成モデルです。強力なプロンプト理解、映画のようなモーション、豊かな視覚的ディテールを備えた、スムーズな1080pのマルチショットビデオを生成します。

seedance
Seedance 1.0 Pro Fast
Seedance 1.0 Pro Fastは、Seedance 1.0 Proファミリーの速度最適化バージョンです。ByteDanceのSeedanceシリーズが持つマルチショットのテキストからビデオ(T2V)および画像からビデオ(I2V)生成の核となる強みを維持しつつ、生成速度の向上と効率化を優先した、より高速で低コストなビデオ生成モデルとして位置付けられています。

seedance
Seedance 1.0 Lite
Seedance 1.0 Liteは、高速かつコスト効率の高いテキストからビデオ(T2V)および画像からビデオ(I2V)の生成を実現するByteDanceの軽量ビデオ生成モデルです。Seedance 1.0ファミリーのよりアクセシブルなバージョンとして位置付けられ、マルチショットビデオ生成、滑らかな動き、短尺アウトプットをサポートしています。

kling
Kling V3.0
Kling V3.0は、Kuaishou(快手)の最新フラッグシップAIビデオモデルであり、ネイティブなマルチモーダル生成のためのオールインワン・クリエイティブエンジンとして位置付けられています。より強力な一貫性、よりフォトリアルな出力、最大15秒のビデオ生成、およびネイティブオーディオに対応し、ハイエンドなシネマティックなText-to-VideoおよびImage-to-Videoワークフローを実現します。
kling
Kling V2.6
Kling V2.6は、映像と音声の同時生成を軸に構築されたKuaishouの動画生成モデルです。クリエイターは動画、音声、対話、効果音を一つのワークフローで同時に生成でき、画面上の映像と音声の整合性が向上しています。

seedream
Seedream 5.0 Lite
Seedream 5.0 Liteは、ByteDanceが開発した統合マルチモーダル画像生成モデルです。高度な推論機能とオンライン検索機能を備えており、プロンプトの深い理解、優れた視覚的推論、そして文脈に即したより正確な画像生成を実現します。

seedream
Seedream 4.5
Seedream 4.5は、ByteDanceが提供するアップグレードされた画像生成・編集モデルです。参照画像の強力な保持による高い一貫性と忠実度、より正確な複数画像編集、そしてタイポグラフィや高密度なテキストレンダリングの向上を実現し、プロフェッショナルなビジュアルクリエイティブ制作を支援します。

seedream
Seedream 4.0
Seedream 4.0は、画像生成と画像編集を単一のアーキテクチャに統合したByteDanceの次世代画像生成モデルです。知識ベースの生成、視覚的推論、リファレンス整合性を保った作成など、複雑なマルチモーダルタスクを処理できるように構築されており、最大4K解像度の高精細な画像を生成します。

seedream
Seedream 3.0
Seedream 3.0は、ByteDanceの高解像度バイリンガル画像生成モデルです。中国語と英語のプロンプト理解、強力なテキストレンダリング、優れた構造的正確性、向上した視覚的美学、およびネイティブな高精細画像作成を実現するために構築されています。

gemini
Nano Banana 2
Nano Banana 2は、Googleの最新の画像生成・編集モデルです。Gemini 3.1 Flash Imageとも呼ばれ、「Flash」の高速性と、より高い視覚的品質、正確な指示追従性、そして精密な編集機能を兼ね備えるよう構築されています。

gemini
Veo 3.1
Veo 3.1 は、デフォルトの背景音声付きで高品質なテキストから動画生成と画像から動画生成を提供する、品質重視の Veo 動画モデルです。

gemini
Veo 3.1 Fast
Veo 3.1 Fast は、デフォルトの背景音声付きでテキストから動画生成と画像から動画生成をすばやく試せる、速度重視の Veo バリアントです。

elevenlabs
Eleven v3
Eleven v3 は、オーディオタグと多言語対応を備えた、複数話者向けの表現豊かなダイアログ音声生成モデルです。

wan
Wan 2.6
Wan 2.6 は、テキストから動画、画像から動画、動画から動画のワークフローを単一の非同期 API で提供する公式 Wan 動画生成モデルファミリーです。