こんにちは。たつやです。
GWの間、Stable Diffusionで遊んでいたものをいくつかの記事に分けて放出したいと思います。
Stable Diffusionでは、ControlNetという仕組みがあって、『大体こんな感じの画像作って』というのを画像で指示することができます。
そこで、(線対称で回転対称な)Xという文字をいろいろなモデルで装飾してもらいました。
※画像のタイリングは、FFmpegによる。詳細は末尾。
生成の詳細は省きますが、モデルごとに表情があって面白いですね。
プロンプトでもっと詳細な指示を与えれば、もっと楽しい画像が生成できると思います。
ちなみに、ControlNetに与えた指示画像はこれ。Inkscapeで描いた何の変哲もない文字です。
ロゴ試作とかにもCotrolNetはお手軽()でよさそうですね。
FFmpegによる画像のタイリング
Windowsのffmpegコマンドでは、ワイルドカードを使ったファイル名の指定(*.png)ができないため、WSL上でLinux用のffmpegコマンドを使ったほうが楽そうだった。
実際のコマンドは、これ。
ffmpeg -pattern_type glob -i ./Xs/*.png -filter_complex tile=4x4 output.png
Xsフォルダ内にある全pngファイルを入力として、4x4のタイル状に配置し、output.pngに保存する。