はじめに

Stable Diffusionで画像を生成するとき、意外と時間を食うのがプロンプト(タグ)の入力です。「あのポーズのタグ、なんだったっけ?」「髪の表現、英語でどう書くんだっけ?」——こうした小さな引っかかりが積み重なると、1枚の画像を出すのに30分以上かかることも珍しくありません。

私自身、以前は画像1枚の生成に30分以上かかっていました。いわゆる「画像生成ガチャ」にハマると60分を超えることもざらでした。

この状況を改善するために、プロンプトをカテゴリごとに管理できるWebシステム「SD Tag Library」を構築しました。この記事では、その仕組みと導入後の変化について紹介します。

課題:プロンプトを覚えていられない

Stable Diffusionのプロンプトは英語で記述します。ポーズ、視線、アングル、髪の動き、手の形——カテゴリだけでも多岐にわたり、それぞれに数十のタグが存在します。

従来の作業フローでは、以下のような手順を踏んでいました。

  • プロンプトの参照サイトを開いて検索する
  • 過去に使ったタグをメモやファイルから探す
  • 英語のスペルが合っているか確認する

これらの手間が画像1枚ごとに発生するため、制作スピードが大幅に低下していました。

解決策:プロンプト管理システムの構築

そこで、自分専用のプロンプト管理システムをWebアプリとして構築しました。

幸い、レンタルサーバーとドメインを契約済みだったため、それらを活用して運用しています。

主な機能

カテゴリ管理:ポーズ、視線、アングル、髪、手、目など、37カテゴリに分類して管理しています。現在の登録タグ数は1,662件です。

日英バイリンガル検索:各タグには日本語名と英語タグの両方が登録されており、どちらの言語でも検索できます。「髪が揺れる」で検索しても「hair swaying」で検索しても、同じタグにたどり着けます。

ワンクリックコピー:タグのコピーボタンをクリックすると、(hair swaying:1.0) のようにウェイト付きの形式でクリップボードにコピーされます。そのままプロンプト欄に貼り付けるだけで使えます。

ウェイト設定:各タグにはデフォルトのウェイト値を設定できます。タグごとに適切な強度を事前に決めておけるため、生成時の試行錯誤が減ります。

タグの追加・編集・削除:個別にタグを追加できるほか、CSVファイルでの一括インポート・エクスポートにも対応しています。後から修正や削除も自由に行えます。

導入後の変化

このシステムを導入してから、画像生成にかかる時間が大きく変わりました。

画像生成ガチャにハマらなければ、1枚あたりおおむね10分以内で完了するようになっています。以前の30〜60分と比較すると、プロンプト入力にかかる時間が大幅に短縮されました。

短縮できた理由は単純です。「タグを思い出す」「調べる」「スペルを確認する」という工程がほぼ消えたためです。

構築の背景:AIを活用した開発

このシステムはAIを活用して構築しました。私はWebアプリ開発の専門家ではありませんが、要求仕様をきちんと策定できれば、AIとの対話を通じてこうしたシステムを形にすることが可能です。

ここで重要なのは、「不便を当たり前として受け入れない」という姿勢です。

日々の作業で「ちょっと面倒だな」と感じることは誰にでもあります。それを「仕方ない」で済ませるのではなく、「AIを使えば解決できるかもしれない」と発想を転換すること——これが、これからの制作活動において大きな差を生むのではないかと考えています。

まとめ

プロンプト管理システムの導入によって得られた効果を整理します。

  • タグを暗記する必要がなくなった
  • 参照サイトへの往復がなくなった
  • プロンプト入力の時間が大幅に短縮された(30〜60分 → 約10分)
  • CSVでのタグ一括管理により、メンテナンスも容易になった

特別な技術がなくても、「こういう仕組みがほしい」という要求を整理できれば、AIの力を借りて実現できる時代になっています。不便を感じたら、それは改善のチャンスかもしれません。