Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

ChatGPT Code Interpreterで画像データを加工してみる

カメラ好き機械学習エンジニアの@yktm31です。

先日、OpenAIから、公式のプラグインとして発表された「Code Interpreter」ですが、 趣味の写真でもなにか使えないかと思い、画像処理を試してみることにしました。

openai.com

Code Interpreterの概要や有効化の方法は前の記事をご覧ください。

acro-engineer.hatenablog.com

以前撮影した、富士山の写真から、Zoomの仮想背景に使うことを想定し、色々と加工させてみたいと思います。

画像処理/加工

今回、以下のような画像処理/加工を実施してみました。

画像サイズの確認

まずは画像のサイズを確認します。

これくらいはお手の物。写真アプリで確認したサイズとも一致しています。

画像をFullHDサイズにする

元の画像のサイズ(5392px × 3592px)は、仮想背景として使うには、大きすぎます。
アスペクト比も、24 : 16 というサイズなので、16:9にしておきたいです。

Code Interpreterにお願いしてみます。

期待どおり、クロップしてくれました。

画像の明るさと彩度を調整する

さて、今の画像は暗くなっているので、明るくかつ彩度も上げて印象をよくしてみたいと思います。

こちらも期待通りの結果になりました。

指定の形で切り抜く

当初、Zoomの仮想背景に使う予定でしたが、SNSのアイコンにも使いたくなりました。
SNS用に、丸で切り抜いてもらいました。

いい感じになったと思います。

データをダウンロードする

これまで加工してもらった画像をダウンロードします。

Code Interpreterにお願いしたところ、丸に切り抜いたものは、JPEGで保存しようとしてエラーが起きたので、 代わりにPNGで保存するよう、Code Interpreter自身でやり直す判断をしています。

まとめ

サイズの変更や図形での切り抜きなど、簡単でもやると面倒な加工は、Code Interpreterにお任せできそうです。
複数画像がある場合は、zipにまとめて一気に処理させても良さそうです。

また画像処理については今回、明るさ・彩度は単純に上げてもらうだけでした。 次回は、ヒストグラム均一化の適用や、アンシャープマスクによるシャープネス調整など、より高度な画像処理もやってみたいと思います。

Acroquest Technologyでは、キャリア採用を行っています。
  • ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
  • Elasticsearch等を使ったデータ収集/分析/可視化
  • マイクロサービス、DevOps、最新のOSSクラウドサービスを利用する開発プロジェクト
  • 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長
  少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。 www.wantedly.com