「stable diffusionとは」の編集履歴(バックアップ)一覧に戻る
stable diffusionとは - (2022/09/08 (木) 00:53:32) のソース
//*stable diffusionの説明の前によくある質問を先に置いておく。 //#contents(page=よくある質問) **1行解説 Memeplexがデフォルトで使っている画像生成AI。いろいろすごい **3行解説 -Stability AI社が発表した画像生成AI。企業や大資本ではなくエンジニアたちのコミュニティで開発が進められた -2022年8月22日にオープンソースで公開=誰でも使える(Memeplexがデフォルトで使っているAIもこれ) -文字列(テキストプロンプト)から画像を生成できる。ほかにもいろいろできる **shi3z氏による説明 ***記事 &bold(){Midjourneyを超えた? 無料の作画AI「 #StableDiffusion 」が「AIを民主化した」と断言できる理由} https://www.businessinsider.jp/post-258369 >オープンソースで無償公開されており、商用利用も可能 >従来の同等品に比べて、画像生成が高速かつ軽量 >一般家庭にあるゲーミングPCで動作可能なほどコンパクト >20億枚の画像と言葉のペアを学習している >NSFW(Not Safe For Work=職場で開くのに相応しくない画像)を自動判定 ***動画 &youtube(https://www.youtube.com/watch?v=KqTUcldWt8g?t=300) &bold(){shi3z氏の話ざっくりまとめ(動画の05:00〜11:00あたり)} 非営利AI研究組織のOpenAIが大規模に画像生成AIの研究開発を始める ↓ ところが技術の自慢話ばかりでモデルもソースもデータセットもなかなか公開されない ↓ そのうちにマイクロソフトと組んだりして企業色が強くなる ↓ 業を煮やしたエンジニアたちが「自前で作ったるわ!」とオンラインで結集 ↓ マジでデータセット集めて論文実装して学習させてみんなでAI作り始めちゃった ↓ OpenAIがようやくDALL-E発表したけどNGワードの制約が強すぎた ↓ 「そんな中途半端な物なら公開するんじゃねえ!」とエンジニア怒る ↓ 別のAI画像生成サービスMidjourneyが公開(有料) ↓ 「俺らのも早く公開するぞ!しろ!」とエンジニアたちが怒り狂って ついに「Stable Diffusion」が公開! コミュニティベースで開発されたオープンソース画像生成AIが爆誕(AIの民主化) **動画による仕組み解説(むずかしい) &youtube(https://www.youtube.com/watch?v=aNdb_RUxtOM)