ブログ
BLOG
近年になって急速に技術が進歩し、様々な場面で作品を目にする機会も増えるなど盛り上がりを見せてきている画像生成AI。巷でも話題になっているので作ってみたいと思いながらも、導入方法や使用方法が難しくてなかなか手を出せずにいる方も多いかと思います。
今回はそんな悩める方々の背中を少しでも押せるような、お手軽に画像生成を体験できるサービスやその使い方などについて、できるだけやさしめにご紹介します。
目次
画像生成AIとは、機械学習アルゴリズムを用いて、世の中にあるたくさんの画像から様々な特徴を学習し、蓄積した膨大なデータをもとに想像から画像を生成してもらう技術のこと。Webデザインや広告はもちろん、医療分野や芸術、アパレル業界やゲーム開発などの場でも活用が進んできています。
現在、リリースされている画像生成AIサービスはたくさんありますが、その中からよく名前を聞くであろう主なものをいくつか簡単にご紹介します。
■Midjourney(ミッドジャーニー)
チャットアプリ「Discord」から、プロンプトを入力して手軽に画像を生成することが可能。現在は有料プランのみの提供となっています。基本的に商用利用可能で、100万ドル以上の年間収入がある企業はProまたはMegaプランの加入が必要になります。
■DALL-E(ダリ)
ChatGPTでお馴染み、OpenAI社が開発したサービス。ChatGPT(Plusユーザー)やMicrosoft Bingの「Image Creator」と「Copilot(Bing Chat)」、Perplexity(パープレキシティ)上から利用でき、最新の「DALL-E 3」ではBingの場合に限りますが、Microsoftアカウントを持っていれば基本的に無料(制限あり)で使うことができます。有料プランの契約に関わらず、規定範囲内での商用利用は可能。
■Stable Diffusion(ステイブル・ディフュージョン)
Stability AI社が2022年に公開したサービス。ソースやモデルなどが無償で公開されており、自前での環境構築ができれば基本的に無料(制限なし)で使うことができます。商用利用も可能ですが、開発元が提供するモデルデータ(SDXLやStable Diffusion Turboなど)を利用するなどで別途料金が発生します。
■Adobe Firefly(アドビ・ファイアフライ)
Adobe社が開発した生成AIモデル。PhotoshopやIllustratorなど、他のCreative Cloud製品への機能搭載が進められています。商用利用も可能で、Adobeが所有する著作権フリーの素材だけでラーニングを行っているため、権利侵害の心配がない(仮に訴訟されてもAdobe側が金銭負担する規約になっている)ことが特徴。
■Novel AI(ノベル・エーアイ)
Anlatan社が提供するサービス。もともとは小説を生成するツールとして公開されましたが、既存の画像や文章などをもとに作風を真似てイラストなどを生成する機能が追加されました。原則商用利用は可能ですが、生成したコンテンツのすべての責任はユーザーが負う規約となっているため注意が必要です。
■Canva(キャンバ)
オンラインで使える無料のグラフィックデザインツールですが、AIによる画像自動生成機能が加えられました。使用可能な上限はありますが、無料で生成機能を使うことができます。Canvaの利用規約内での合法的な商用利用は可能。
今回は数ある生成AIサービスの中から、Stable Diffusionを使ってみようと思います。
某オタク向けマッチングアプリの広告がきっかけで、界隈では一躍有名にもなったこのStable Diffusionですが、お手持ちのパソコン環境に合わせて2種類の使い方を選ぶことができます。
とにかくお手軽に始めてみたい初心者におすすめの方法です。
クラウド上で仮想マシンに環境を構築しブラウザを経由して利用するため、高性能なパソコンを持っていなくても使用できることがメリットです。また、お手持ちのパソコンへの煩雑なインストール作業も不要になります。
■Hugging Face
■Google Colab
■Stable Diffusion Online
■Dream Studio
■PICSOROBAN
など
デメリットとしては、仮想マシンをレンタルするため基本的に有料であること、利用するプラットフォームによって生成できる枚数に制限が設けられていたり、大人向けなど一部センシティブなジャンルの生成がNGで自由度が低いことなどがあげられます。
Hugging Faceでは、最新バージョンであるStable Diffusion 3.5を含めデモ版を無料で体験することができるので、試しに使ってみることにします。ちなみに、Large / Large Turbo / Mediumの3種類がありますが、Largeから順に高品質な画像を出力することができます。もし不具合などがありましたら順番にグレードを落としてお試しください。
■参考
・Stable Diffusion 3.5 Large (8B) - Hugging Face
https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
・Stable Diffusion 3.5 Large Turbo (8B) - Hugging Face
https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo
・Stable Diffusion 3.5 Medium (2.6B) - Hugging Face
https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-medium
Stable Diffusionは、任意に入力したテキスト情報から画像を生成する「txt2img」を採用しています。入力規則は非常にシンプルで、複数の英単語をカンマで区切ったプロンプト(指示文)を入力するだけで画像ができあがります。必要に応じて詳細なキーワードを増やすことで、出力したい画像のイメージにより近づけていくことが可能です。これって、なんとなくスタバの注文に使う呪文に似ているような…。
ここでは、赤枠の入力窓にカンマ区切りで生成したい画像のイメージを入れて、「Run」ボタンを押します。
処理が終わるまでしばらく待つと、こんな画像が生成されます。
あらかわいい~~! ちなみに私は犬より猫ちゃんのほうが好きです!
画像下にある「Advanced Settings」を開くと、画像サイズなどより詳細な設定を入れることができます。一番上のSeed値を変えると、1回目に処理したものと異なるイメージ画像を生成してくれます。特に規則性はないので、範囲内の適当な数字を入れればOK(Randomize seedにチェックを入れると自動でランダム指定になります)
Stable Diffusionはソースやモデルなどを無償公開しており、PythonやGitなどのコンポーネントファイルと以下いずれかのWebアプリケーションをお手持ちのパソコンにインストールすることで、自由に利用することができます。
■Stable Diffusion WebUI(AUTOMATIC1111版)
■Stable Diffusion WebUI Forge
■ComfyUI
■Fooocus
など
ローカル上にサービスを構築できるため、仮想環境で利用する場合に設けられていたあらゆる制約や課金から解放されます(商用利用する場合は一部料金が発生する可能性あり)。ただし、インストールには処理能力に優れたハイスペックなパソコン(GPU搭載が必須)と手間のかかる導入作業が必要になるため、それなりの設備投資と知識が求められます。
初期設定のままでも様々な画像を生成できますが、さらにモデル(checkpointとLoRA)による追加学習やVAE(高画質化ツール)を駆使したり、もうひとつの生成方式である「img2img(画像から画像を生成する)」を使うことで、特定の人物や画風などを再現したオリジナリティ溢れる画像を生成することが可能になります。
前者の仮想環境で試してみてから、本格的にもっとガッツリ使ってみたいぞって気持ちにさせられた方はぜひともチャレンジしてみてください!
今回は画像生成AIの簡単な使い方からできることについて解説しました。
上手に使いこなせば画像を探したり撮影したりする手間など、業務効率の改善にもつなげられる一方で著作権の侵害や情報漏洩、フェイク情報の生成(ハルシネーション)など、気をつけるべき注意点やリスクも同時に存在します。知らず知らずのうちに起こっている事故も多いため、安全な生成システムの選定・構築やセキュリティリテラシーを高めることなどが求められます。
AIによる生成技術は日々急速に進化しており、画像のみならず動画も自在に作ることができるようになりつつあります。画像に比べるとまだまだできることに限りはありますが、将来的に普及が進めば大幅な業務効率化が期待できそうです。
AI生成物は著作権侵害になる?「AIと著作権に関する考え方について」解説
【簡単比較】オススメは?エンタメAIサービスまとめ!【イラスト・文章・チャット】
ほっしー
エンジニア
制作部に所属、2024年に入社。コーディングを軸に10年以上、ホームページ制作からWeb開発、ECサイト管理まで幅広い経歴を持っている。スタバではよくカフェミストを頼みがち。