話題のDream machineを試してみた 2024年7月現在、AIによる動画生成がホットな話題である。無料で高品質な動画が生成出来るLUMA Dream machine、有料だが映画品質の動画が生成できるRunway GEN-3 Alpha、そして現在はアナウンスを受けて登場待ちのOpenAI Sor…
スマホ紛失で購入 もうすぐiPhone16が販売されるが、スマホを落とすというトラブルがあり、急きょiPhone15ProMaxを入手した。 改めてのレビュー。 時計表示が消えない(設定で消える) 小さなマルチファンクションボタンが追加された(カメラSWが良さそう) …
運転免許証入りのスマホを落とした 車から降りた際にスマホケースに入ったスマホを落としてしまった。合わせて落とした一式は以下である。 スマホ(iPhoneXS) 運転免許証 会社のカードキー 自宅のカードキー スマホを落として改めてその大変さを実感した。…
①新しく作業を開始する: git init GitHub発ではなく、ローカルPCのWorking TreeをGitで履歴管理を開始したい場合のコマンド。Gitで管理したい対象フォルダに移動した上で実行すればそのフォルダがGitで管理される。 git init 現在所在するフォルダをGit対象…
OneDriveとGitの併用 Gitを用いる最大の効果はバージョンなど履歴管理と過去のcommit時点に戻せる点にある。その上で個人が複数PCを用いて開発を継続する手法としては、OneDriveとの併用が今のところ快適である。 なおGitHub Codespacesを用いる方法も優れて…
gitを導入する Windows11での利用を以下で説明 Gitインストールと設定 プログラムなどの対象フォルダをgitで履歴管理が出来る様にする GitHubでリモート管理する ①Gitインストール ブラウザでgitと打ち込んでダウンロードサイトからDLしてインストール Git B…
バレットジャーナル用として長年愛用しているコクヨのA5方眼罫ノート。 新しいノートを使っているとどうも見づらくて書きにくい。目が悪くなったせいかと考えたがあまりにおかしいので前と比較すると、明らかに罫線が薄くなっている! 出来れば前の濃さに戻…
グルテンフリーのパンを焼く事情が発生し、大麦粉、ライ麦粉、米粉、オートミール粉それぞれ100%のパンを焼いてみた。結果としてはいずれもコツを掴めば、美味しいパンが焼けることが分かったのでここでまとめる。 なお大麦、ライ麦、オートミールには食物繊…
確定申告のやり方を一から記録 ここ数年、ふるさと納税や医療器控除などでやってきてはいるが、毎年どうやったかを綺麗に忘れてしまうため、自分自身のために確定申告のやり方を一からメモする。所用時間は1〜2時間程度。 手順 ①準備するもの PC:作業用 i…
2024/2時点で最高スペックのAIエッジデバイス 生成AIをエッジで動かしたいニーズが高まりつつあり、手軽にGPUを動かせるJetsonシリーズの内、2024/3時点で最高スペックのJetson AGX Orinを入手したので、導入ステップを備忘録として残す。 Jetson AGX Orin …
ポメラから他への出力は問題ないが 既に述べている通り、ポメラは快適な文字入力デバイスで便利に使用している。またポメラで作成した文書はポメラシンクという機能でメモと同期させてたり、ブログ記事やメール宛先に送信することも簡単だ。 しかしながら最…
漢字の字体 日本語の主要文字として使われる漢字は紀元前2,000年頃と推定されている甲羅や骨に刻み込まれた甲骨文字が最初に登場し、その後金文、大篆、篆書体(小篆)、隷書体、草書体、行書体、楷書体と書道と共に発展した。その後印刷の登場で、宋朝体、…
1.漢字の読み SNSなどで時々日本語の難しさが議論になることを見かける。特に外人にとっては日本語は易しさと難しさがそれぞれある様だ。 易しさとしては、母音が5つしかない、中国語の様な四声がない(フラットな発音)、ひらがなまたはカタカナだけなら…
久しぶりにポメラからブログへ ポメラが故障して(液晶ドライバ破損とのこと)修理で戻ってきたので(修理代は約2万円)、久々にポメラからブログへのUPを試してみる。 修理で帰ってきたポメラ 実に簡単だ。 ポメラのメニューで「ツール」ー「アップロード」…
30枚の画像を1秒で生成 Emad氏が、Stable Diffusion2.1で秒間30コマの驚異的速度での画像生成を発表した。これはプロンプトに変更を加える度に即座にリアルタイムで絵が変化するという、今までとは全く異なる使用感が得られる次世代の画像生成を意味しており…
明確な意思の基に作られる大規模モデル 明らかな方向性を持つ大規模モデルが複数作られつつある。 仕事で安心して使える様にSFW(safe for work)を徹底したStable Diffusion2.0 その生成画像がつまらないという批判を受けて改善を重ねるStable Diffusion2.1…
OpenAIに刺激されて登場 Perplexity.aiがOpenAI ChatGPTに刺激されて?動作可能なデモを出した。 これはOpenAI WebGPTに触発されたデモであり、商品ではありません。このエンジンは大規模な言語モデル(OpenAI API)を使用して検索します。精度は検索結果とAI…
InvokeAI2.2 Stable Diffusionの実装環境の一つであるInvokeAIが2.2にバージョンアップした。 キャンバスを自由に拡張できる OutpaintingおよびInpainting、img2imgをカバー、Mac M1/M2,Windows, Linuxに1クリックインストールを実現している。 www.youtube.…
GoogleDrive上で実行 この記事は前にまとめたGoogleDrive上にAUTOMATIC1111のcloneを実装する運用に、比較実証などで高速にモデルを切り替える方法を加えたもの。AUTOMATIC1111はロードした5つ程のモデルを動的に切り替えて運用出来るが、モデルを高速にセ…
正式対応で高速化を実現 AppleがM1/M2チップへの機械学習フレームワーク「Core ML」の最適化を発表し、MacBookなどM1/M2搭載機のコードを公開した。 machinelearning.apple.com github.com Gigazineの記事によると、M2搭載機でStable Diffusion 2.0をステッ…
ChatGPT GPT-3.5のパフォーマンスを無料で試せるサイトが登場した。 chat.openai.com 正直ヤバいレベルで歴史から言語、哲学から科学など、どんな質問にもスラスラと答える。いくつか例を示す。(日本の地理はダメな模様) 「C言語で#Hello,C"」と質問 する…
色々なモデル学習方法 モデルの追加学習方法は数百枚~数万枚の画像データで行う純粋なDiffusion Modelの追加学習から、1枚、あるいは数枚程度の軽微な学習まで色々あり、Google colabで行える方法をまとめた。 なお学習したモデルやFine-tuningはAUTOMATIC…
CLIP STUDIO PAINTへのAI描画機能を中止 クレームが殺到?したのか発表したAI描画機能搭載中止のアナウンスがあった。 皆様からいただいたご意見を重く受け止め、CLIP STUDIO PAINTへ画像生成AI機能を搭載しないことといたしました。皆様に新しい創作の体験…
AUTOMATIC1111へのモデル等の配置 colab上で利用できるAUTOMATIC1111は、各モデルやFine-tuningしたデータを正しく格納すると動的に切り替えられる。以下順に説明する。 ①modelの配置: 複数のモデルを動的に切り替える利用や、モデルをマージしたい場合も含…
GoogleDriveにAUTOMATIC1111をclone この記事は過去記事の続きで、ローカルPCに近い感覚で高速起動させる方法を説明する。colab利用の場合、通常はcolab側のドライブにAUTOMATIC1111をcloneするが、それをGoogleDrive側にcloneすることで一式インストールさ…
自分好みのモデルを作る Stable Diffusionでは様々なモデルを選べるが、モデルを自分好みにカスタムすることも出来る。モデルを特定対象に特化する方法はいくつか存在する。 vanilla fine-tuning(一般的な追加学習) Texture Inversion(数枚~のデータ) H…
Stable Diffusion2.0をcolabで使う 数日前に登場したStable Diffusion2.0は、1.5までとは異なる構成のため、モデルの変更だけでは使えない。現時点ではStableDiffusion2.0の5つあるモデルの内、768x768モデルのみ利用方法が開示されたのでそれを説明する。 …
colab ノートAkaibu1.3対応 簡単かつエラーが出なくなった新しいcolabノートが利用出来るので、そちらをベースに記事を書き直した。またモデルやVAEファイルなどを動的に切り替え可能とすべく、正規の場所に配置する内容に改訂した。 想定する読者 Google co…
Stable Diffusion 2.0の5つのモデル 本日Stable Diffusionの最新版である2.0が、同時に5つのモデルを公開した。 5つのモデルの種類 512x512の標準モデル(base) 768x768の標準モデル X4拡張モデル depth2img:深度情報が扱えるモデル inpaintingに優れる…
ジブリモデル ジブリの絵を学習させたモデルが2つ登場。 ①Ghibli-Diffusion スタジオジブリのアニメ長編映画の画像(15,000枚)でトレーニングされたモデル。プロンプトに" ghibli style"を入力する必要がある。 プロンプト例: ghibli style beautiful Carib…