そういう、モデルなんです。

ビジネスモデル、3Dモデル、設計図、模型などの現状と動向を考察、関連書籍の紹介

画像生成AIどれがおすすめ?

よくある話題ですみません。画像生成AIには、いろいろ種類があります。

 

youtube.com

簡単なのは、Edge から使える Bing Image Creator、DALL-E 3

日本語で、普通に文章を打ち込むだけで、人物、風景、物体、どれでもそれなりの絵が出ます。プロンプト(呪文)の文章を解析する能力が高いです。

公式サイトのプロンプト例で試すといいでしょう。

A detailed oil painting of an old sea captain, steering his ship through a storm. Saltwater is splashing against his weathered face, determination in his eyes. Twirling malevolent clouds are seen above and stern waves threaten to submerge the ship while seagulls dive and twirl through the chaotic landscape. Thunder and lights embark in the distance, illuminating the scene with an eerie green glow.

無償で1日あたり15回×4枚の出力が可能なので、常用するならコレでしょうね。

但し、標準の画像サイズは1024の正方形となります。よって動画投稿に組み込む場合、正方形の動画にしたほうが楽ですね。

また自分が生成した作品は、最近の20回分かしか履歴に保存されないので、どういうプロンプトで生成したのかは、どこかに自分で記録しておかないと再現できなくなります。

Canva からも DALL-E は利用できます。

無償では、ほとんど使えませんでした(3回で打ち止め)。

DALL-E のバージョンが古いのか、制約なのか分かりませんが、Bing Image Creator から出力した場合と比べると、やや劣っていた印象です。

まあ3回しか試せなかったので、その範囲での印象に過ぎませんが…

youtube.com

Magic Studio の下のほうから起動できます。最近、左側のメニューバーにも DALL-E ボタンが増えていました。

有償ですが、PowerDirector AI画像生成(Beta)でも、ほぼ同じです。

そうだとはどこにも書かれていないので断定できませんが、多分、バックエンドは DALL-E なのではないかと推測しています。

スタイル指定が選択式で、素人には助かります。
日に5枚しか出力できないので、毎日、作りだめしてます。

高品質の画像を出すのは面倒ですが、Stable Diffusion

DALL-E と比べて、プロンプトの文章を解析する能力が低いです。
いまのところ基本的に英語なので Google 翻訳と併用して作文することになるでしょう。

それゆえ高品質の画像を出すのは面倒ですが、ローカルにインストールすれば、堪能(学習)できます。

  • 回数を気にせずに使える。
  • 好きな大きさの画像を出せる。
  • プロンプトに投入した単語の効き目を行列で確認できる。

などなど、付帯する加工処理がある場合、とても便利です。 

適用するモデルによって出力がかなり異なるうえ、プロンプトを丁寧に指定しないと、作画崩壊するので素人には難しかった印象です。

youtube.com

ローカルにインストールする場合、複数のソフトウェアをインストールする必要があり、モデルは6GBもあるのでダウンロードにも時間がかかります。

テクスチャ画像の生成などの目的では、それ用のオプション指定(タイル化処理: Tiling)ができるし、苔むした石垣だとか、簡単に装飾をすることもできるので、テクスチャサイトを探し回るよりも楽だと思います。

youtube.com

自分が生成した画像のプロンプトは、自分のローカル環境に保存されている履歴の画像からいつでも逆引きできるので、プロンプトを別途記録しておかなくても大丈夫です。

youtube.com

MidJourney

絵画の作品コンクールで一等をとってしまった画像を生成したカドで、にわかに有名になった位、高品質な画像が出せるらしいです。

とある大手企業の方と雑談していたら、Adobe Firefly と MidJourney は設計部門で試していると言っていたので、仕事で使えるレベルなのでしょう。

最近は有償らしいのと、個人的にはもうDALL-Eでいいかになっているので、試していません。画像サイズの変更だとか、Stable Diffusion で手間かけてやっていることが普通にできて、高品質とのことなので、そのうち試すかもしれません。