3月末のアップデートでGPT-4oの画像生成能力が格段に向上したことで、また生成AI界がにぎわっています。
端的には写真のようなリアリティのある画像の生成の能力が高まったことが目玉だと思います。
たとえば、「東京の河川敷を20代前半の男性ランナーがジョギングする、写真のようにリアルな画像を生成してください。季節は春です。」とプロンプトを入力すると、以下の画像が生成されました。

ちょっと本物のスティーブ・ジョブズとは顔が違う気がしますが、人物描写のリアリティの向上には目を見張るものがあります。
(なお、現在は実在の人物の画像生成が可能ですが、今後は不可能になるのではないかという気がします。アップデート後の数日の間にも、たとえば子どものリアルな画像生成は却下されるなど、制限が強化されてきています。)
さて、こうした画像生成能力の向上の一方で、地味ながら私が便利だと感じたのが、透過色を描けるようになったこと。
もしかしたら以前もできたのかもしれませんが、過去に試したときにはうまくいきませんでした。
透過ができるようになると、ロゴやピクトグラムの生成が容易になります。
たとえば、「メロンのピクトグラムを生成してください。黒塗りのシンプルなイラストで、背景は透過、正方形にしてください。」というプロンプトに対して、以下の画像が生成されました。

また、たとえば以下の写真をアップロードしたうえで「添付の写真の内容のミカンを水彩画にしてください。背景は透過にしてください。」とプロンプトを入力すると、以下のイラストが生成されました。


こうした画像素材はちまたにたくさんありますが、自分が求めているテイストのものがなかなか見つからないということはよくあります。
いまや、画像素材は探すよりも生成したほうが早いくらいです。
いま、農業経営に関する電子書籍を用意しているのですが、GPT-4oの画像生成機能のパワーアップによって、挿絵の作成も大変簡単になりました。
イラストレーターでなくとも、さらに多様な場面で画像・イラストを活用することができるようになります。
なお、GPT-4oの画像生成は無料でも使うことができます。