Anlatan Inc.
自然言語プロンプト、マルチキャラクタープロンプト、キャラクターのポジション指定、アクションタグ、ケモノスタイル生成などの最新機能を搭載
Anlatan Inc.(本社:米国、CEO:Eren Dogan)は、AI支援創作プラットフォーム「NovelAI」において、最新の画像生成モデル「NovelAI Diffusion V4 Full版」を正式リリースしたことをお知らせいたします。本モデルは2023年末に公開したV4 Curatedプレビュー版から大幅に進化し、約23万時間のH100コンピューティングリソースを活用して開発されました。より高品質な画像生成と直感的な操作性を実現しています。
■背景と概要
アニメ調の画像生成AIの需要が高まる中、より細かな表現力と操作性が求められています。「NovelAI Diffusion V4 Full版」は、従来のV3モデルと比較して画質と忠実性を大幅に向上させながらも、処理速度は従来とほぼ同等を維持しています。プロセス改善により、ユーザーの意図をより正確に反映した画像生成が可能になりました。
↓「NovelAI Diffusion V4 Full版」リリース動画
■主な新機能
1. 自然言語によるプロンプト
- 英語の自然文によるシーン描写が可能になり、タグを覚える必要なく直感的な指示が可能に
- プロンプトの文脈サイズを512トークンに拡張し、より詳細な指示や説明文に対応
- CLIPからT5テキストエンコーダーへ移行することで文章の意図や文脈の理解力が大幅に向上
- 上級ユーザーは自然言語と従来のタグを組み合わせることで、より細かな制御が可能に
NovelAI Diffusion V4 Full版 自然言語プロンプト機能
2. マルチキャラクタープロンプト
- 1つの画像に最大6人の異なるキャラクターを同時配置可能となり、複雑なグループシーンが作成可能
- 各キャラクターのプロンプトを個別に設定できるため、特徴の混在を防ぎキャラクターの一貫性を維持
- キャラクター設定をドラッグ&ドロップでインポートできる簡単な保存・共有機能
NovelAI Diffusion V4 Full版 マルチキャラクタープロンプト機能
3. キャラクターのポジション指定
- 画像内の各キャラクターの位置を自由に指定可能となり、構図の制御性が向上
- 従来はランダム配置だったキャラクターを、意図した場所に正確に配置できるように
NovelAI Diffusion V4 Full版 キャラクターのポジション指定機能
4. アクションタグ
に関してはそれだけではありません。アクションタグによって、キャラクター間のやりとりを新たなレベルで制御できます。どのキャラクターがどのような行動をとり、誰に対して行うのかを指定できるため、場面におけるキャラクター関係を正確にコントロールできます。例えば、「誰が誰を抱きしめているか」「誰が誰に話しかけているか」などの関係性を明確に指定できます。
source#(行動する側): 行動を起こすキャラクターを指定
例: source#hug → キャラクターが抱きしめる行動をします
target#(行動される側): 行動を受けるキャラクターを指定
例: target#hug → キャラクターが抱きしめられます
mutual#(相互行動): お互いに同じ行動をするときに使用
例: mutual#hug → 指定したキャラクター同士がお互いを抱きしめます
NovelAI Diffusion V4 Full版 アクションタグ機能
5. フォーカスインペイント
- 画像の一部分のみを高解像度で再生成する機能で、元の画像との調和を保ちながら部分修正が可能
- 顔、手、小物など、細かな表現が必要な部分を選択するだけで自動的に高精細化
- 選択部分は約100万ピクセルまで拡大されて再生成されるため、ディテールが大幅に向上
- Opusプランでは大きな画像でもAnlas(ポイント)を消費せず使用可能
NovelAI Diffusion V4 Full版 フォーカスインペイント機能
6. 画像品質と忠実度の向上
- SDXLのVAEからFlux VAEへの移行により、色彩表現と細部描写が飛躍的に向上
- U-Netの計算リソース最適化によって、より詳細でシャープな画像生成を実現
- 処理速度は従来モデルとほぼ同等を維持
NovelAI Diffusion V4 Full版 画像品質向上
7. テキストレンダリング
-
吹き出し内のテキストや画像内テキストの生成が可能となり、漫画やイラスト制作が進化
- 英語テキストの配置やスタイルを自然言語で指定でき、直感的な操作が可能
NovelAI Diffusion V4 Full版 テキストレンダリング機能
8. ケモノモデル内蔵
-
プロンプトの先頭に「fur dataset」と入力するだけで、専用モデル同等の機能が利用可能
- 従来は別モデルだったケモノアート生成が本体に統合され、切り替えの手間が解消
- ファーリーやケモノアートスタイルのファンに向けた使いやすさの向上
- 他の新機能(マルチキャラクター、ポジション指定など)と組み合わせて使用可能
■今後の展開
近日中に「バイブストランスファー(Vibe Transfer)」機能を追加予定です。この機能により、スタイル転送がさらに進化し、より多様な表現が可能になります。
■サービス利用について
NovelAI Diffusion V4 Full版は、NovelAIの公式サイト(https://novelai.net/)でご利用いただけます。なお、最新モデルをご利用いただくには、新しい決済システムへの切り替えが必要です。クレジットカードでの更新には5000 Anlas、PayPalでの更新には2000 Anlasのボーナスがプレゼントされます。
■Anlatan Inc.について
Anlatanは、AIを活用したクリエイティブ支援ツールを開発・提供しています。2021年の設立以来、NovelAIはストーリーテリングに焦点を当てたテキストベースのLLM(大規模言語モデル)生成から画像生成へと拡大してきました。同社の画像生成モデルは、高品質なアニメイラスト生成に強みを持ち、世界中のクリエイターから支持を得ています。
■プレスリリースに関するお問い合わせ
Anlatan Inc. 広報担当:press@anlatan.ai
NovelAI公式サイト: