diffusersでAnimagineXL3.1を使ってローカル環境で画像生成してみる【Python】

2024年9月30日2024年10月1日Diffusers

昨今、様々なツールの登場で画像生成はかなり身近なものになりつつありますが、やはりPythonでゴリゴリにコードを書いて画像生成するのも、自動化等を鑑みると考えなくてはならないところかと思います。

今回は、Animagine XL 3.1というモデルを使って、Pythonで画像生成する方法を紹介します。

1. 必要なライブラリをインストールする
2. 画像生成する
- 2.1. サンプルコード
- 2.2. パラメータについて

必要なライブラリをインストールする

pip install diffusers transformers accelerate safetensors --upgrade

画像生成する

サンプルコード

以下は公式で紹介されているサンプルコードです。
※CUDA環境でないと動作しません。

import torch
from diffusers import DiffusionPipeline

pipe = DiffusionPipeline.from_pretrained(
    "cagliostrolab/animagine-xl-3.1", 
    torch_dtype=torch.float16, 
    use_safetensors=True, 
)
pipe.to('cuda')

prompt = "1girl, souryuu asuka langley, neon genesis evangelion, solo, upper body, v, smile, looking at viewer, outdoors, night"
negative_prompt = "nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]"

image = pipe(
    prompt, 
    negative_prompt=negative_prompt,
    width=832,
    height=1216, 
    guidance_scale=7,
    num_inference_steps=28
).images[0]

image.save("./output/asuka_test.png")

seed指定がありませんので出力結果はランダムになりますが、実行してみたところ、以下の結果が得られました。