MarkdownとBullet Journal

いわゆるプログラマーのつぶやき

中国のAI画像生成 ERNIE-ViLG

ERNIE-ViLG

米国のMidJourney, Stable Diffusionなどに続き、中国の百度(バイドウ)が開発した画像生成。PCのローカル環境でも実行出来るが、簡単に生成出来るデモページが用意されており下記リンク先でデモを体験できる。

huggingface.co

実証

下記の画面の様に、スタイルはCartoon(アニメ・漫画)を選び、希望するイメージのプロンプト(日本語でOK)を記載する。噂通り二次元イラストに強いと感じる。生成のコツとしてプロンプトにpixivを加えると画像レベルが一気に上がる様だ。

ERNIE-ViLG入力画面

下のイラストは「金髪ロング美少女 , pixiv俳名第一」だけで生成されたもの。お手軽すぎる気もするがまあいいだろう。

ERNIE-ViLGで生成
ERNIE-ViLGで生成
ERNIE-ViLGで生成

MidJourney 自分だけの領域で画像生成

他人の画像に流されたくない

MidJourneyを使っていると次々と他人の生成画像が流れてくるのがうざい。あるいは何回も自分の画像生成が出てくるのが気が引ける。この様に考える人は多いと思うので、解決するチップスのみ記載。但しサブスク購入の方限定。

なおこの方法で生成された画像は他の手段で他人に見られるので、非公開にしたい場合は有料プラン+プライベートモードを追加課金すれば他人に見えない仕様になる。

解決方法

自分だけの画像生成出来るスペースで作業する。これだけ。具体的にはMidJourney Botを活用。

1.まずDiscordの画面で一番左上のDiscordのアイコン(白カエル)をクリック。すると画面のようにMidJourney Botが表示される。

左上のカエルアイコンをクリックするとMidJourney Botが現れる

2.このMidJourney Botの中で、これまでと同様に/imagineコマンドを使えばOK

3.なお一番最初に承諾クリックを求められるのでメッセージ欄の左下にある承認ボタンをクリック

MidJourneyとFaceApp

MidJourneyの顔編集

男女入れ替え機能で一世風靡したFaceAppをMidJourneyと組み合わせる事で、MidJourneyで自動生成された今ひとつな人物の顔を自分好みに編集出来る。AI技術の合わせ技として使えると思う。

 

左が元の生成、右がFaceApp

f:id:ProgrammingForEver:20220911174438j:image

f:id:ProgrammingForEver:20220911174450j:image

f:id:ProgrammingForEver:20220911174506j:image

 

## 白人に変更

KacACサイトを使って、オマケで1枚目の女性を白人にしてみる。背景やウェアの情報が飛んでしまったのは残念。

f:id:ProgrammingForEver:20220917160838j:image

f:id:ProgrammingForEver:20220917160949j:image

f:id:ProgrammingForEver:20220917161547j:image

KaoACのリンクは以下。

年齢、性別、人種を変換kaoAC

 

 

 

MidJourney, DreamStudio, Dall-E2 比較レビュー

画像生成の比較

AI自動画像生成ツールとして2022年9月現在メジャーになっているのは、MidJourney、DreamStudio(Stable Diffusion)、Dall-E2。Dallから招待メールがやっと届いた事もあり、色々と記事が出ているが自分の目で出来栄えの差を確認するという観点でトライ。結論としてはそれぞれ良さがあり、魔法の筆を3本手に入れたと考えるのが良さそうだ。

絵本に出てくる王女

下記のプロンプトをそれぞれ入力してみた。

beautiful sad princess with long curly dark hair dressed in white clothes, sitting tea table in a beautiful garden with peonies, roses, wisterias and jacarandas, lavender, realistic painting, illustration, ethereal

MidJourney --testオプション
DreamStudioで生成
DreamStudioで生成
DALL-E2で生成
DALL-E2で生成

MidJourneyはグラビア調、DreamStudioは絵本調、DALL-E2はイメージプロットといった感じか。

古代の剣

プロンプトは以下の通り

ancient antique sword of nature powered by the crystal of water , ornate ,intricate, ART NOUVEAU , jewelry, copper

MidJourney
DreamStudio
DreamStudio
Dall-E2
DALL-E2

MidJourneyは幻想的、DreamStudioは実写的、DALL-E2は現実的、といった感じか。それぞれの違い(個性)をしばらく楽しむことにする。

優れたレビュー記事紹介

もっと詳細な比較記事があったので紹介。

threadreaderapp.com

MidJourney --test, --testp, --creativeオプション

betaに続く画像改善オプション

beta終了後に怨嗟の声渦巻くと言っても過言ではないDISCORDだったが、今日新たなoptionとして--test,--testpが登場した。以下公式からのアナウンス。

みなさん、新しい画像作成システムの --test をやってみようと思います。 このテストは 24 時間から 48 時間続きます (ユーザーの行動とモデレーターのフィードバックによって異なります)。このテストは、美学と一貫性を単一のシステムに統合するための取り組みです

  • 注:現在も--test,--testp,--creativeは有効
  • 1) --test と入力:汎用アーティスティック モードに変わる
  • 2) --testp と入力:フォトリアリズム モードに変わる
  • 3) --creativeを追加:よりクリエイティブなタイプにしたい場合
  • 各設定は /settings パネルから切り替えることもできる

私たちは、システムがどの程度創造的であるべきかをまだ理解しようとしています。これまでのところ、私たちのガイド/モッドは写真の創造性をあまり好みませんでした。汎用モードには均等な分割がありました。(個人的には --creative が大好きですが、確かにちょっとカオスです)

既知の制限: このテストは、マルチ プロンプトまたはイメージ プロンプトをサポートしていません。 サポートされている最大アスペクト比は 3:2 または 2:3 です。各コマンドは、2 つの正方形の画像、または非正方形の画像を 1 つ作成します。プロンプトの前にある単語は、後ろにある単語よりも重要な場合があります。システムは形容詞よりも名詞にロックすることがあります。今後数週間、定期的にモデルを変更する予定です。

さて早速試してみた。ノーマル(V3)では今ひとつ、--testでは奥ゆかしい感じ、--testpで下の様な絵が出た。

japanese girl, --testp

※この後、上の絵を色々とアプリで加工した記事はこちら

programmingforever.hatenablog.com

--testなどの作例

--test, --testp, --creativeの指令を加えた作例を探したい場合は、別記事にも載せたMidJourneyのCommunity feedの活用がオススメ。ここの検索キーに「--test」「--testp」を入力すると対象の作例が出てくる(下のリンク)。

https://www.midjourney.com/app/feed/all/

その他含めプロンプトの情報などを載せた記事

programmingforever.hatenablog.com

簡単に作例紹介

全体の声を聞くと今回の新オプションを歓迎する声がある反面、betaのレベルには至らないという意見が多数あるようだ。特にポートレートに関しては--testはかなり頑張っているが、それ以外は今一つらしい。とりあえず#test-showcaseの中から優れた絵を数点挙げてみる。

#test-showcase

#test-showcase

MidJourneyの2022.8.24betaに乗り遅れる

神生成されるbeta

MidJourney (V3)は生物や乗り物などの左右対称の再現性がやや低く、悪夢のような画像を生成することが多かった。その点DreamStudioはリアルな絵の生成に強かった。しかし昨日24時間限定で登場したMidJourneyのbetaはいきなりその問題を解決して、均整のとれた映像を生み出せる様になった。

現時点ではAIで生成された画像の著作権は明確ではなく(法的に整備されていない、但し既存の肖像権を犯すのは✖️)存在しないとの情報に基づき、DISCORDのbeta-showcaseにUPされた作品を一部転載する。

MidJourney 2022-8-24betaで生成された画像
MidJourney 2022-8-24betaで生成された画像
MidJourney 2022-8-24betaで生成された画像
MidJourney 2022-8-24betaで生成された画像

私は残念ながらbeta情報に気付くのが遅く自分では生成出来なかった。その他有益なネット情報をメモる。

togetter.com

[https://togetter.com/li/1934577:embed:cite]

www.youtube.com

AI自動画像生成 MidJourney, DreamStudio, Stable Diffusion

自動で画像生成

人間が何らかの画像(イメージ)を求める場合、今までは①画家等による絵やイラストの作成(アナログからCGまで)、②カメラを用いた撮影とその加工(Photoshop)、③3Dモデリングを用いた映像作成(3DCG)があったが、ここに新しく④AIで画像を自動生成する4番目の手法が誕生した。

1. 画家による絵筆やPCを用いた絵画・イラスト

紀元前からの壁画に始まり、水彩画や油絵、デッサンなど人が見たものや想像したものを自らの手と絵筆などを用いて絵画を創作する行為。やがてPC上で作品を作るデジタルアートも生まれたが、アナログ手法とデジタルアートのいずれも優れた作品を作るためには技量と感性、そして時間が必要である。

油絵作成

2. カメラマンによるカメラやPCを用いた写真・加工

19世紀に発明されたピンホールカメラから映像を写しとる装置としてカメラは普及した。絵に比べると誰でも簡単に正確な映像が得られる様になった。やがてデジタルカメラが登場しスマホで誰でもいつでも写真が撮影できる時代になった。またフィルム写真の頃から加工技術は存在し、現在Photoshopなど優れたアプリで写真加工も簡単に行える。但し優れた作品を作るためにはカメラ、技量、感性、そして撮影場所へ移動するフットワークが必要である。

Photoshopを用いた写真加工

3. 3DデザイナーによるPCを用いた3DCGによる画像・映像

ここから映像の(AIの自動生成とは意味が違うが)自動生成が始まる。最近のディズニー映画などが分かりやすい例だが、3Dデザイナーが人物および背景の3Dモデルを作成し、作成した三次元空間に於けるライティングとカメラワークを駆使することで映像を作る。3Dポリゴンを用いたゲームも同様でリアルタイム演算により、状況の変化に応じた画像を自動生成する。これも優れた作品を作るためには3Dデザイナー、技量、感性、それなりの投資金が必要である。

リアルタイム3Dポリゴンゲームの例(Dead or Alive

4. AIによる自動画像生成での画像・映像

以上述べたこれまでの手法に対して、この8月にメジャーになったAIによる自動画像生成は非常に強力であり、誰でも簡単に試すことができる。プロンプトと呼ばれる生成のための文言を与えると数秒から数分程度で画像が生成される。指定によって絵画や線画、写真、3Dモデル風など様々なバリエーションが生まれる。登場したばかりだが、現在優れた作品を作るためには練られたプロンプト(呪文)と優れたAI環境が必要である。

DreamStudioで生成(馬程度の簡単な指定)

MidJourney βの利用方法

2022年8月に一気にブレイクして一躍有名になったMidJourney。幻想的な映像が得意で動物や鳥類の描画は苦手(--test,--testpの登場で改善)。生成時間は1分程度。

利用手順①:Discordのアカウント取得

下のURLをクリックしてDiscordに移動してアカウントを取得

discord.com

利用手順②:MidJourneyに移動

下のURLをクリックしてMidjourneyのトップ画面にアクセスし、「Join the beta」ボタンを押す。

www.midjourney.com

利用手順③:メール認証を済ませてログイン

登録したメールアドレス宛に招待メールが届くのでそれを用いてログイン

利用手順④:AI画像生成

  • newbies-**のいずれかの部屋に入る
  • 最末尾に移動して/imaginと入力
  • プロンプト入力待ち受けになるので好きな言葉を入力

その他の画像生成サービス

WOMBO Dream

  • サイトにログイン(下のサイト)
  • より簡単なコマンドで生成

app.wombo.art

LAIONプロジェクトのOngo

  • サイトにログイン(下のサイト)
  • より簡単なコマンドで生成

replicate.com

DreamStudio Lite β

Stable DiffusionをMidJourneyやDALL-E2の様に使えるwebサービスとしてDreamStudioが登場。リアルな映像が得意で動物や鳥類も自然に描く。生成時間は6秒程度と高速

利用方法:

  • DreamStudioにログイン(下のサイト)
  • テキストボックスに好きな言葉を入力

beta.dreamstudio.ai

DALL-E2

9/29から申請不要ですぐに使える様になった(下記URL)。

labs.openai.com

MidJourney, DALL-E, Stable Diffusionの比較検証記事

threadreaderapp.com

関連情報

note.com

note.com

note.com