MarkdownとBullet Journal

いわゆるプログラマーのつぶやき

Imagic 特定の写真や絵を変化させる

Imagic解説の写真

Imagicとは

10月17日に発表された。加工したい画像を1枚用意して、それに対してプロンプトを与えると、元の画像の一貫性を保ったままプロンプトで指定した画像加工が行える技術。これまでPhotoshopで行ってきた様な各種の画像加工が行える。上の写真はそれぞれ左の元の写真に対してプロンプトで加工した例。なお元画像を学習させる必要があるため、学習時間が20分以上必要。

実際にやってみる

①colabのサイトにアクセス

※オリジナル(英語版)

Google Colab

※リーサさんによる日本語版

Google Colab

②写真を用意

元の写真を用意する(ファイル名は英数字のみ、スペースもエラーになる)。

加工前の写真

③プロンプトを用意

例としてメガネをかけさせてみる。TARGET_TEXT:に「girl wearing glasses」を入力。

上から順に実行させて(約30分モデル学習にかかる)終わった成果が下の写真。

Imagicで生成されたメガネをかけた写真

服装も変わったり、少し顔の角度も変わっている。元の写真とは少し違う顔になっているがパラメータ調整でこの辺りは追い込めるようだ。

ちょっと使いにくい

しかしながら元の写真とプロンプトをセットでモデル学習させる今のやり方では、プロンプトを変更する度にかなりの時間がかかってしまうし、都度巨大なモデルが作られてしまう。例えばFaceAppならメガネをかけたり髪を変更するのも一瞬だ。下の写真(右側)はFaceAppで加工したもの

FaceAppでメガネ追加、髪型変更

よってImagicは近日中に写真の学習のみ行って、プロンプトは後から自由に変更できるDreamboothに近いやり方に変更されると思う。