導入できました。どうやって使えばいいの?
ひとまずそれぞれのサービスで1girlと入れてみてください。
女の子の画像が表示されれば成功です。
女の子の画像が表示されれば成功です。
キーワード(プロンプトと呼びます)を入力して、画像を生成する。
この過程のことを、text to image(テキストトゥイメージ)と呼びます。
略称はt2iです。
この過程のことを、text to image(テキストトゥイメージ)と呼びます。
略称はt2iです。
または、適当に好きな画像を用意して、image to image と呼ばれる場所にアップロードし、1girlと打ち込んで生成してみてください。
画像が女の子に変化したら成功です。
変化の具合は用意した画像、Strengthの強さ、Noiseの度合い、Seed値などで変わりますので、どう変わるかはまちまちですが、おそらく女の子の絵に変化したと思います。
画像(imageと呼びます)を入力して、画像を生成する。
image to image, もしくはi2iと言います。
image to image, もしくはi2iと言います。
何でもいいから絵を出してみたい
プロンプトメーカーを使いましょう。
https://aiart-navi.com/?p=396
https://aiart-navi.com/?p=396
もしくはAIアート専門のサイトに載っている作例のプロンプトを入れてみましょう。
なお、このWikiはAIピクターズの有志によって作成されています。
https://www.aipictors.com/
なお、このWikiはAIピクターズの有志によって作成されています。
https://www.aipictors.com/
コピペすればできあがりです。簡単ですね。
「どこにコピペすればいいの?」等、UIの操作法については以下のサイトを参照してください。
NovelAIで基本操作を学ぶ
基本操作については
https://docs.google.com/document/d/1adnXKyQwNyXAa5g0PiG3lqcBWGH959LdBEYit22xJGc/edit#heading=h.v9vszdvgipf3
このサイトが参考になります。
無料の分を使って練習してみてください。
https://docs.google.com/document/d/1adnXKyQwNyXAa5g0PiG3lqcBWGH959LdBEYit22xJGc/edit#heading=h.v9vszdvgipf3
このサイトが参考になります。
無料の分を使って練習してみてください。
すべて読めばレベル2は卒業です。
ここでは読んだことを前提として、NovelAI以外のサービスでのプロンプトの組み方を簡単に説明します。
Mid,Nijijourney
対応トークン数は75までです。
トークンとは何かと言われると困るのですが、どうもAIがプロンプトを読み込むときに、単語ごとに区切りをつけているのではなく、独自の区切り方をして文章を解釈しているのだということです。
ローカル環境では現在、トークン数の制限はありません。
つまりおおよそ65ワード以上書き込むと、それ以降は切り捨てられてしまうので無意味だということになります。
トークンとは何かと言われると困るのですが、どうもAIがプロンプトを読み込むときに、単語ごとに区切りをつけているのではなく、独自の区切り方をして文章を解釈しているのだということです。
ローカル環境では現在、トークン数の制限はありません。
つまりおおよそ65ワード以上書き込むと、それ以降は切り捨てられてしまうので無意味だということになります。
では現在何トークンなのかを確認するにはこのサイトが便利です。
https://kawaiiprompter-streamlit-clip-counter-app-kb643n.streamlit.app/
→作成者のnote https://note.com/diff_momot/n/na110b91b1530
https://kawaiiprompter-streamlit-clip-counter-app-kb643n.streamlit.app/
→作成者のnote https://note.com/diff_momot/n/na110b91b1530
Mid,Nijiは画風やテクスチャーの再現が非常に得意で、それらの単語を入れると綺麗に絵を作ってくれます。
たとえばPVC coat(ポリ塩化ビニルコート)という単語を入れると、キラキラしたビニール風の質感が画面に反映されます。
サイバーパンク桃太郎という有名な漫画がありますが、ネオンサインが光る近未来の絵が欲しければ、cyberpunkと入れるだけでOKです。
また、有名な画家風のイラストも得意です。
詳しくは公式HPのCommunityFeedを覗くと、参考になるプロンプトが多数掲載されています。
https://midjourney.com/showcase/top/
たとえばPVC coat(ポリ塩化ビニルコート)という単語を入れると、キラキラしたビニール風の質感が画面に反映されます。
サイバーパンク桃太郎という有名な漫画がありますが、ネオンサインが光る近未来の絵が欲しければ、cyberpunkと入れるだけでOKです。
また、有名な画家風のイラストも得意です。
詳しくは公式HPのCommunityFeedを覗くと、参考になるプロンプトが多数掲載されています。
https://midjourney.com/showcase/top/
Midのi2iは、あらかじめ画像をDMなどにアップロードしておき、プロンプトの入力時に、URLを先頭に乗せてから続けてプロンプトを入力することで可能です。詳しくはFAQを見てください。
とりんさまアート
日本語入力も可能です。トークン数は現在300までです。
モデルの学習法やタグ分類の法則性が公開されていないため、伸びしろは感じるもののガチャ要素が強いモデルです。
風景画も含めた構図は非常に多彩で、キャラ絵も80年代から2022年まで幅広く表現できます。
モデルによって得意不得意がありますので、大まかな構図を『とりん』で作ってから、重ね書き/アップスケールで『でりだ』『でりだ♭』などで人物のイラストを修正する、などの使い方が可能です。
プロンプトはでりだ♭が一番シンプルに利用可能で、初心者におすすめです。
Nijijourneyよりももっと少ないプロンプト数(10~20トークン)できれいにまとまったイラストを作成してくれます。
モデルの学習法やタグ分類の法則性が公開されていないため、伸びしろは感じるもののガチャ要素が強いモデルです。
風景画も含めた構図は非常に多彩で、キャラ絵も80年代から2022年まで幅広く表現できます。
モデルによって得意不得意がありますので、大まかな構図を『とりん』で作ってから、重ね書き/アップスケールで『でりだ』『でりだ♭』などで人物のイラストを修正する、などの使い方が可能です。
プロンプトはでりだ♭が一番シンプルに利用可能で、初心者におすすめです。
Nijijourneyよりももっと少ないプロンプト数(10~20トークン)できれいにまとまったイラストを作成してくれます。
HolaraAI
ランダム生成ガチャで出てくる呪文を利用すると綺麗な絵が出やすいようです。
これはHolaraのモデルが独自に行っている追加学習時にその呪文をタグづけしているからかと思われます。
学習外のタグを使うと破綻しやすいようなので、有効なタグの範囲でシンプルに記述するのがおすすめです。
これはHolaraのモデルが独自に行っている追加学習時にその呪文をタグづけしているからかと思われます。
学習外のタグを使うと破綻しやすいようなので、有効なタグの範囲でシンプルに記述するのがおすすめです。
TIPS
追加学習のタグ
Holaraなどの独自モデルは追加学習を行っています。新たな画像とタグのセットを用意して、ベースモデルに付与することで、独自色が出るという仕組みです。
いくつかの手法が存在しますが、現在主流のLoRAは用意した画像・タグペアの重みづけ(重みベクトル・内部のパラメータ)を変化させることで出力画像に変化をもたらします。
たとえばベースモデルに1万枚の猫画像が学習されていたとすると、「猫」というタグで出てくる画像は色々な猫が入り交じったものになりますが、折れ耳のスコティッシュフォールドの画像ばかり何十枚か用意して追加学習を行うと、折れ耳の猫が出てくるようになります。
その際、発動のキーとなる単語を新しく登録するのですが、作者が独自に考案したキーワードの他に、汎用的なタグをいくつか付与しておくこともあります。
独自モデルに追加学習されている美麗イラストを呼び出すには、このトリガータグを覚えて使用する必要があります。
追加学習に使われているタグは公式が配布していることが多いので、そちらを参照してください。
また、現在はdanbooruのタグ分類法を採用する人が多いですので、もしも分からなければいったんdanbooruのタグで試してみるのもありだと思います。
重みづけは何十億パラメータもある複雑なものですので、こうすれば正解という手法はまだないようです。モデルごとの特性は実際に使用して確認しましょう。
Holaraなどの独自モデルは追加学習を行っています。新たな画像とタグのセットを用意して、ベースモデルに付与することで、独自色が出るという仕組みです。
いくつかの手法が存在しますが、現在主流のLoRAは用意した画像・タグペアの重みづけ(重みベクトル・内部のパラメータ)を変化させることで出力画像に変化をもたらします。
たとえばベースモデルに1万枚の猫画像が学習されていたとすると、「猫」というタグで出てくる画像は色々な猫が入り交じったものになりますが、折れ耳のスコティッシュフォールドの画像ばかり何十枚か用意して追加学習を行うと、折れ耳の猫が出てくるようになります。
その際、発動のキーとなる単語を新しく登録するのですが、作者が独自に考案したキーワードの他に、汎用的なタグをいくつか付与しておくこともあります。
独自モデルに追加学習されている美麗イラストを呼び出すには、このトリガータグを覚えて使用する必要があります。
追加学習に使われているタグは公式が配布していることが多いので、そちらを参照してください。
また、現在はdanbooruのタグ分類法を採用する人が多いですので、もしも分からなければいったんdanbooruのタグで試してみるのもありだと思います。
重みづけは何十億パラメータもある複雑なものですので、こうすれば正解という手法はまだないようです。モデルごとの特性は実際に使用して確認しましょう。
StableDiffusion
オープンソースで様々なモデルのベースになっているモデルです。
NovelAIのベースもSDです。
ほとんどのモデルの始祖に当たるので、一度は本家のマニュアルに目を通しておくと捗ります。
StabilityAI社のマニュアル(サインイン必須)
https://beta.dreamstudio.ai/prompt-guide
NovelAIのベースもSDです。
ほとんどのモデルの始祖に当たるので、一度は本家のマニュアルに目を通しておくと捗ります。
StabilityAI社のマニュアル(サインイン必須)
https://beta.dreamstudio.ai/prompt-guide
とにかく大量の画像が学習されています。
しかしタグづけが機械で適当に行われただけというものが多く、プロンプトが少ないとぼんやりした変なキメラが出ます。
良質な画像に絞って出力させるには大量のプロンプトが必要です。
しかしタグづけが機械で適当に行われただけというものが多く、プロンプトが少ないとぼんやりした変なキメラが出ます。
良質な画像に絞って出力させるには大量のプロンプトが必要です。
海外の人ウケするフォトリアルな作風なので日本語のマニュアルは少なめ。
プロンプトの作例は
https://www.reddit.com/r/StableDiffusion/
redditによく転がっています。
プロンプトの作例は
https://www.reddit.com/r/StableDiffusion/
redditによく転がっています。
WaifuDiffusion
Danbooru記法のサイトです。
Danbooruのタグを並べるといい感じになります。
ベースはSDなので、調整する場合はSDの呪文を混ぜます。
Danbooruのタグを並べるといい感じになります。
ベースはSDなので、調整する場合はSDの呪文を混ぜます。
NovelAIの呪文とも親和性があります。
Waifu・NovelAI両方ともStableDiffusionにDanbooruの画像とタグで追加学習を行ったモデルです。
Waifuの方が追加学習の精度が粗いので、SD式の大量プロンプトをかませるか、LoRAをかぶせるといい感じになりやすいようです。
追加学習が進むと絵が固定化しがちですが、粗いとプロンプトとEmbeddingsがよく効きます。
これは絞り口がついていない生クリームのようなもので、そのままだと絵が描きにくいですが、適切な重みづけを学習させ、きちんとした型金をつけると、狙い通りのデコレーションができる、というようなイメージです。
元々絞り口がついている生クリーム(追加学習が進んだAI・Holara等)だと、追加しても綺麗には出ませんよね。
Waifu・NovelAI両方ともStableDiffusionにDanbooruの画像とタグで追加学習を行ったモデルです。
Waifuの方が追加学習の精度が粗いので、SD式の大量プロンプトをかませるか、LoRAをかぶせるといい感じになりやすいようです。
追加学習が進むと絵が固定化しがちですが、粗いとプロンプトとEmbeddingsがよく効きます。
これは絞り口がついていない生クリームのようなもので、そのままだと絵が描きにくいですが、適切な重みづけを学習させ、きちんとした型金をつけると、狙い通りのデコレーションができる、というようなイメージです。
元々絞り口がついている生クリーム(追加学習が進んだAI・Holara等)だと、追加しても綺麗には出ませんよね。
その他、Custom Model
カスタムモデルには大まかに五種類の派閥があります。
SD系
StableDiffusionをベースにしたモデル。海外製のモデルに多い。
WD系
WaifuDiffusionをベースにしたモデル。
NAIリーク系
外部に流出したNovelAIをベースにしたモデル。
でりだ系
とりんアートのでりだをベースにしたモデル。
OJ系
OpenJourneyをベースにしたモデル。
StableDiffusionをベースにしたモデル。海外製のモデルに多い。
WD系
WaifuDiffusionをベースにしたモデル。
NAIリーク系
外部に流出したNovelAIをベースにしたモデル。
でりだ系
とりんアートのでりだをベースにしたモデル。
OJ系
OpenJourneyをベースにしたモデル。
海外製はSD+OJ、日本製はNAIが主流です。
モデルのベースを確認すれば、それぞれの記法が使用できます。
ベースモデルの記法に、追加学習のトリガーキーを使って記述するといい結果が得られるでしょう。
なお、リークモデルの使用は自己責任でお願いします。
まとめ
- プロンプトの作り方はモデルによってまちまち
- 迷ったらできるだけ簡単なモデルを使う(Niji>とりん>Holara・カスタムモデル>NAI>SD・WDの順でプロンプトが長くなります)
- よく分からない場合はDanbooruのタグを入れる
- プロンプトメーカーを使う