MarkdownとBullet Journal

いわゆるプログラマーのつぶやき

2022-01-01から1年間の記事一覧

Progressive distillation:リアルタイム画像生成の実現

30枚の画像を1秒で生成 Emad氏が、Stable Diffusion2.1で秒間30コマの驚異的速度での画像生成を発表した。これはプロンプトに変更を加える度に即座にリアルタイムで絵が変化するという、今までとは全く異なる使用感が得られる次世代の画像生成を意味しており…

Stable diffusion2.1〜、Waifu Diffusion1.4〜、Unstable Diffusion、Clean Diffusion

明確な意思の基に作られる大規模モデル 明らかな方向性を持つ大規模モデルが複数作られつつある。 仕事で安心して使える様にSFW(safe for work)を徹底したStable Diffusion2.0 その生成画像がつまらないという批判を受けて改善を重ねるStable Diffusion2.1…

最新の話題にも回答するAIチャット: Perplexity.ai

OpenAIに刺激されて登場 Perplexity.aiがOpenAI ChatGPTに刺激されて?動作可能なデモを出した。 これはOpenAI WebGPTに触発されたデモであり、商品ではありません。このエンジンは大規模な言語モデル(OpenAI API)を使用して検索します。精度は検索結果とAI…

InvokeAI2.2

InvokeAI2.2 Stable Diffusionの実装環境の一つであるInvokeAIが2.2にバージョンアップした。 キャンバスを自由に拡張できる OutpaintingおよびInpainting、img2imgをカバー、Mac M1/M2,Windows, Linuxに1クリックインストールを実現している。 www.youtube.…

colab:AUTOMATIC1111で高速にモデルを切り替える

GoogleDrive上で実行 この記事は前にまとめたGoogleDrive上にAUTOMATIC1111のcloneを実装する運用に、比較実証などで高速にモデルを切り替える方法を加えたもの。AUTOMATIC1111はロードした5つ程のモデルを動的に切り替えて運用出来るが、モデルを高速にセ…

AppleがStable Diffusionに正式対応

正式対応で高速化を実現 AppleがM1/M2チップへの機械学習フレームワーク「Core ML」の最適化を発表し、MacBookなどM1/M2搭載機のコードを公開した。 machinelearning.apple.com github.com Gigazineの記事によると、M2搭載機でStable Diffusion 2.0をステッ…

ヤバい。GPT-3.5のChatGPTが凄すぎる

ChatGPT GPT-3.5のパフォーマンスを無料で試せるサイトが登場した。 chat.openai.com 正直ヤバいレベルで歴史から言語、哲学から科学など、どんな質問にもスラスラと答える。いくつか例を示す。(日本の地理はダメな模様) 「C言語で#Hello,C"」と質問 する…

colabで出来るモデル学習のやり方

色々なモデル学習方法 モデルの追加学習方法は数百枚~数万枚の画像データで行う純粋なDiffusion Modelの追加学習から、1枚、あるいは数枚程度の軽微な学習まで色々あり、Google colabで行える方法をまとめた。 なお学習したモデルやFine-tuningはAUTOMATIC…

中止:クリスタのAIの試験サービス搭載を取り止め

CLIP STUDIO PAINTへのAI描画機能を中止 クレームが殺到?したのか発表したAI描画機能搭載中止のアナウンスがあった。 皆様からいただいたご意見を重く受け止め、CLIP STUDIO PAINTへ画像生成AI機能を搭載しないことといたしました。皆様に新しい創作の体験…

colab:model,VAE,Textual Inversion,Dreambooth,Hypernetworkの配置

AUTOMATIC1111へのモデル等の配置 colab上で利用できるAUTOMATIC1111は、各モデルやFine-tuningしたデータを正しく格納すると動的に切り替えられる。以下順に説明する。 ①modelの配置: 複数のモデルを動的に切り替える利用や、モデルをマージしたい場合も含…

colab:GoogleDriveにAUTOMATIC1111をcloneして高速実行

GoogleDriveにAUTOMATIC1111をclone この記事は過去記事の続きで、ローカルPCに近い感覚で高速起動させる方法を説明する。colab利用の場合、通常はcolab側のドライブにAUTOMATIC1111をcloneするが、それをGoogleDrive側にcloneすることで一式インストールさ…

colabでモデルをマージする

自分好みのモデルを作る Stable Diffusionでは様々なモデルを選べるが、モデルを自分好みにカスタムすることも出来る。モデルを特定対象に特化する方法はいくつか存在する。 vanilla fine-tuning(一般的な追加学習) Texture Inversion(数枚~のデータ) H…

Google colabのAUTOMATIC1111でStable Diffusion2.0を使う

Stable Diffusion2.0をcolabで使う 数日前に登場したStable Diffusion2.0は、1.5までとは異なる構成のため、モデルの変更だけでは使えない。現時点ではStableDiffusion2.0の5つあるモデルの内、768x768モデルのみ利用方法が開示されたのでそれを説明する。 …

【改訂Akaibu1.3】 colabでAUTOMATIC1111を便利に使う

colab ノートAkaibu1.3対応 簡単かつエラーが出なくなった新しいcolabノートが利用出来るので、そちらをベースに記事を書き直した。またモデルやVAEファイルなどを動的に切り替え可能とすべく、正規の場所に配置する内容に改訂した。 想定する読者 Google co…

Stable Diffusion 2.0が5つのモデルで登場

Stable Diffusion 2.0の5つのモデル 本日Stable Diffusionの最新版である2.0が、同時に5つのモデルを公開した。 5つのモデルの種類 512x512の標準モデル(base) 768x768の標準モデル X4拡張モデル depth2img:深度情報が扱えるモデル inpaintingに優れる…

ジブリモデル:Ghibli-DiffusionV1, StudioGhibliV4

ジブリモデル ジブリの絵を学習させたモデルが2つ登場。 ①Ghibli-Diffusion スタジオジブリのアニメ長編映画の画像(15,000枚)でトレーニングされたモデル。プロンプトに" ghibli style"を入力する必要がある。 プロンプト例: ghibli style beautiful Carib…

Nijijourney:二次元特化のMidjourney

Nijijourney Midjourneyの二次元特化サービスであるNijijourneyのベータサインアップが提供されている。 サインアップのリンク先: https://o9q981dirmk.typeform.com/nijijourney?typeform-source=gigazine.net 申請から1週間程度のウェイティングが過ぎて受…

Adobe,Google,NVIDIAのAI画像生成ツール

各社から発表 Adobe,Google,NVIDIAの各社からAI画像生成ツールの発表があり、いずれも近日中に利用できる見込み。 Adobe - Creative Cloudに追加 米Adobeは10月19日、クリエイター向けの画像生成AIを開発すると発表。倫理や法律面などをクリアにした画像生成…

二次元絵・アニメモデルが次々と登場

AnythingV3.0、EimisAnimeDiffusion、Evt_V2、Evt-V3、HD-17、デリダ、Elysium、ACertainModel、ACertainThing、8528d-final 記事の最後に各モデルのダウンロード先と利用方法をまとめた。 ハイレベルな二次元の絵が作成できるモデルが次々と登場している。…

StableRes:Stable Diffusionのモデルなどのカタログ

StableRes 日々増えていくStable Diffusionのモデルや有益なツールを一覧化してダウンロード出来る便利なサイト。必要とするものをクリックするとモデルなどのダウンロードが行えるなど便利。但し毎日の様に新モデルが登場するのでリストの更新が遅れる場合…

DreamArtistをcolabで使う

1枚の絵だけで学習するDreamArtist 複数枚の絵で学習させるDreamBoothに対して1枚の絵だけで学習できるDreamArtistが登場した。AUTOMATIC1111で使えるとのことなので早速Google colabで試してみた。 DreamArtistとは 必要なファイルをDL出来るサイトは以下…

絵師、技師、術師を考える

AI画像を生み出す人々 Stable Diffusion、NovelAIDiffusionなど「プロンプトエンジニアリング」によるAI画像生成は、与えた言葉に基づいて芸術と科学(工学)が一体となって画像を作り出す、これまでに無かった新しい芸術的手法と言えよう。 またこの世界では…

colabで使えるStable DIffusion web UIの色々

Stable DIffusion web UIの実行環境や種類 Stable DIffusion web UIの実行環境はWindows、Linux、Mac(一部のみ)、Google colab、Paperspaceと色々ある。 web UIアプリケーション用PythonライブラリもGradio、Streamlit等ある Stable DIffusion web UIの種…

StabilityAI公開の新VAE(改良オートエンコーダー)

VAE(改良オートエンコーダー) Stable Diffsion1.5、そのimpainitingVAE版の公開に続いて、StabilityAIからモデルのオートエンコーダ部を置換するVAE(改良オートエンコーダー)が公開された。 huggingface.co 公開されたのはモデルに含まれるオリジナルのk…

AI画像生成のトレンド

AI画像生成の流行 ツイッターでAI画像サービスのトレンド分析記事があり、面白かったので転載。 ※2022.10.17調べ 日本の場合 最初にMidJourneyがブームになり、次にStable Diffusion、現在はNovelAIDiffusionがダントツ。MidJourneyはほとんど使われなくなっ…

Photoshop Generative AI への期待など

AdobeがAI生成対応を発表 AdobeがPhotoshopでinpainting、outpaintingを自由に行えるデモ動画を発表した。 https://blog.adobe.com/en/publish/2022/10/18/media_1f3f6d79aa6f17ef5b8d870e3fc6cf4819fadcf3d.mp4 サイトはこちら blog.adobe.com デモ動画を見…

Stable Diffusion 1.5 inpainting版を試す

inpainting用StableDiffusion 1.5 モデル 先日突然Stable Diffusion1.5を公開したRunwayMLが、続いてStable Diffusion1.5のinpainting用モデルを公開した。 github.com モデルの違いの説明 現在、次のチェックポイントを提供している。 sd-v1-1.ckpt: laion2…

Imagic 特定の写真や絵を変化させる

Imagic解説の写真 Imagicとは 10月17日に発表された。加工したい画像を1枚用意して、それに対してプロンプトを与えると、元の画像の一貫性を保ったままプロンプトで指定した画像加工が行える技術。これまでPhotoshopで行ってきた様な各種の画像加工が行える…

NovelAI/Waifuのネガティブプロンプト/プロンプト活用情報

WaifuDiffusionでネガティブプロンプトを使用 二次元作例のレベルが上がってきた 二次元作成にかける情熱は熱く、ネガティブプロンプト活用などによる優れた作例情報が入手できるサイト情報をまとめた。 使えるネガティブプロンプト ネガティブプロンプトの…

【AUTOMATIC1111対応】Stable Diffusion 1.5 公開

Stable Diffusion 1.5をAUTOMATIC1111(colab)で使用 Stable Diffusion 1.5 DreamStudio、Photoshop向けのアドインツールでは利用可能だったStable Diffusion 1.5のモデルなどが公開された(一部の仲間によるリークらしいが)。下記サイトにアクセスして承認を…