Stable Diffusionを使ってみたい!最近話題のAIを使っての画像生成ですが、何から始めていいのか分からない人や英語表記の多い海外発のサービスを利用するのにとまどったりする人は多いのではないでしょうか。
この記事では、画像生成AIサービスの中で最もメジャーであるStable Diffusionの特徴や使い方、生成例などを初心者向けにまとめて解説していきます。
Stable Diffusionとは?
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月にリリースされたAI技術を利用して画像を生成するオープンソースの画像生成AIサービスです。
Stable Diffusionは、ソースコードや学習済みの機械学習モデルが無償で公開されているので、それを利用したサービスやアプリも多くリリースされています。
入力したテキスト(プロンプト)情報を元に簡単にクオリティの高い画像を作ることができ、商用利用することも可能です。
Stable Diffusionの導入方法
Stable Diffusionの導入方法は、大きく2種類あります。
ここでは、Webブラウザで利用する場合とローカル環境を構築して利用する場合に分けて説明していきます。
WEB版Stable Diffusion「Dreamstudio」
WebブラウザでStable Diffusionを利用する場合はいくつかのサービスサイトから選ぶことになります。
今回は、「Dreamstudio」を利用します。
「Dreamstudio」とは、Stable Diffusionの開発元であるStability AI社が公開している公式ウェブアプリです。
パソコンのスペックに関係なくStable Diffusionの画像生成機能を利用することができます。
Dream Studioはアドレスの登録、またはGoogleアカウント連携を開始したあとに利用可能となり、無料クレジット付与分を使い切った後は従量課金が必要となります。
Dreamstudio利用方法
右上の「Get started」ボタンをクリックして進みます。
右上の「Login」ボタンをクリックしてアカウントの登録を行います。
トップページに戻り、クレジットが付与されているのを確認します。
ローカル版Stable Diffusion
ローカル版Stable Diffusionとは、Stable Diffusionの機能リソースを自分のPC環境にダウンロードして画像生成機能を利用することを意味します。
今回は、Stable DiffusionのWeb UIで一番使いやすい「AUTOMATIC 1111」の設定方法をご紹介します。
推奨環境の確認
まずはPCの推奨環境を確認します。
条件を満たしていない場合はStable Diffusionがマニュアル通りに安定しないことがあるので注意しましょう。
PC/OS | デスクトップ型 Windows10-11(64bit) |
CPU | IntelCore i5~Core i7、AMD Ryzen 5~7 |
GPU | RTXシリーズのVRAM 12GB以上 |
メモリ | 16GB~32GB |
ストレージ | 512GB以上 |
Macにインストールする方法はこちらをチェック
Pythonのインストール
Python(パイソン)とはStable Diffusionの起動に必要なプログラム言語のパッケージです。
Stable Diffusionの起動に必要なPythonのバージョンは「3.10.6」と決まっていますので、3.10.6以外のバージョンが既にPCに入っている場合は、削除してからインストールしましょう。
次に、Pythonバージョン「3.10.6」を選択してダウンロードします。
インストーラーを開き「Add Python 3.10 to PATH」にチェックを入れて進めます。
Gitのインストール
Gitとは、プログラムのファイルを管理するシステムで、Stable Diffusionにも必要です。
サイトからダウンロードしたインストーラーを開き、「Next」ボタンをクリックして進めていきます。
チェックボックスやオプションは特に追加する必要はありません。
Stable Diffusion Web UI(AUTOMATIC1111)のダウンロード
Stable Diffusion Web UIを格納するフォルダを作成します。
フォルダ名が長いとエラーが起きてしまう場合があるので、Cドライブ直下に今回はフォルダ名「SD」で作成します。
「SD」フォルダを開き、フォルダ内で右クリックして「Open Git Bash here」を選択します。
すると次のような「コマンド入力画面」が出てきます。
コマンド入力画面で「$」が表示されている行に下記のコマンドを入力します。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
コマンド入力後、SDフォルダの中に「stable-diffusion-webui」のフォルダが作成されていることを確認します。
※ステップ4は「推奨環境」が揃っていない場合のみ実行してください。
推奨環境が揃っている場合は、ここを飛ばして「ステップ5」へ進んでください。
「stable-diffusion-webui」フォルダ内の「webui-user.bat」を右クリックし、「編集」を選択してメモ帳で開き、編集します。
※メモ帳が開いている状態で「webui-user.bat」をドラッグ&ドロップすることでも編集できます。
▼GPUを持っているが、メモリが4GB以下の場合
6行目にある「set COMMANDLINE_ARGS=」を下記に書き換え「上書き保存」します。
set COMMANDLINE_ARGS=--skip-torch-cuda-test
▼GPUを持っていない場合(非推奨)
6行目にある「set COMMANDLINE_ARGS=」を下記に書き換え「上書き保存」します。
set COMMANDLINE_ARGS=--skip-torch-cuda-test --upcast-sampling --no-half-vae --use-cpu interrogate --precision full --no-half
※こちらのコマンドは本来GPUで処理する計算をCPUに振り分ける内容です。
CPUに大きな負荷がかかったり、本来のパフォーマンスで生成される画像が生成されない場合があります。
利用の際は自己責任にてお願い致します。
書き換え後
「webui-user.bat」をダブルクリックして、Stable Diffusion Web UIのダウンロード&インストールを開始します。
ダウンロードは数10分から1時間ほどかかりますので、気長に待ちましょう。
「Running on local URL:~」が表示されればインストール完了です。
ダウンロードが終了したら黒い画面を閉じて「webui-user.bat」をダブルクリックすると「Stable Diffusion Web UI」が立ち上がります。
Stable Diffusionの使い方
それでは実際にStable Diffusion Web UI(AUTOMATIC1111)を使って画像を生成してみます。
今回は「忍者」の画像を生成したいと思います。
Stable Diffusionは日本語の入力は受け付けていないので、「ninja」と打ち込み生成ボタンをクリックします。
ゲージが100%になるまで待ちます。
書き出された画像はフロッピーディスクのアイコンをクリックして保存することが出来ます。
保存した画像は下記の場所に格納されます。
C:\SD\stable-diffusion-webui\outputs\txt2img-images\保存した日の日付
Stable Diffusionのプロンプト日本語化拡張機能
Stable Diffusion Web UIを日本語化する方法を紹介します。
そのまま利用する場合は英語でのナビゲーションで分かりづらいので、日本語化しておきましょう。
Stable Diffusion Web UI内「Extensions」の「Available」タブに切り替えます。
「Available」タブ内の「localization」のチェックを外し「Load from」ボタンをクリックします。
表示された拡張機能一覧の中から「ja_JP Localization」をインストールしましょう。
「Settings」タブから「User interface」をクリックし、画面上部にある「Localization(requires Reload UI)」から「ja_JP」を選択します。
その後、「Apply settings」をクリックして保存し、「Reload UI」でStable Diffusionを再起動すれば完了です。
※タブの中が空白の場合は、すぐ右にある青い更新ボタンをクリックします。
再起動後、Stable Diffusion Web UIが日本語になっていることを確認します。
Stable Diffusionのような画像生成AIにはクラウドGPUがおすすめ
推奨環境を見ていただくとおわかりのように、Stable Diffusion Web UI(AUTOMATIC1111)をスムーズに利用するには、高スペックなパソコンが必要です。
所有のPCスペックが足りていない場合やノートパソコンなどで利用する場合には、クラウド環境で使うのがおすすめです。