カメラ好き機械学習エンジニアの@yktm31です。

先日、OpenAIから、公式のプラグインとして発表された「Code Interpreter」ですが、趣味の写真でもなにか使えないかと思い、画像処理を試してみることにしました。

Code Interpreterの概要や有効化の方法は前の記事をご覧ください。

acro-engineer.hatenablog.com

以前撮影した、富士山の写真から、Zoomの仮想背景に使うことを想定し、色々と加工させてみたいと思います。

画像処理/加工

今回、以下のような画像処理／加工を実施してみました。

画像サイズの確認
画像をFullHDサイズにする
画像の明るさと彩度を調整する
指定の形で切り抜く
データをダウンロードする

画像サイズの確認

まずは画像のサイズを確認します。

これくらいはお手の物。写真アプリで確認したサイズとも一致しています。

画像をFullHDサイズにする

元の画像のサイズ（5392px × 3592px）は、仮想背景として使うには、大きすぎます。
アスペクト比も、24 : 16 というサイズなので、16：9にしておきたいです。

Code Interpreterにお願いしてみます。

期待どおり、クロップしてくれました。

画像の明るさと彩度を調整する

さて、今の画像は暗くなっているので、明るくかつ彩度も上げて印象をよくしてみたいと思います。

こちらも期待通りの結果になりました。

指定の形で切り抜く

当初、Zoomの仮想背景に使う予定でしたが、SNSのアイコンにも使いたくなりました。
SNS用に、丸で切り抜いてもらいました。

いい感じになったと思います。

データをダウンロードする

これまで加工してもらった画像をダウンロードします。

Code Interpreterにお願いしたところ、丸に切り抜いたものは、JPEGで保存しようとしてエラーが起きたので、代わりにPNGで保存するよう、Code Interpreter自身でやり直す判断をしています。

まとめ

サイズの変更や図形での切り抜きなど、簡単でもやると面倒な加工は、Code Interpreterにお任せできそうです。
複数画像がある場合は、zipにまとめて一気に処理させても良さそうです。

また画像処理については今回、明るさ・彩度は単純に上げてもらうだけでした。次回は、ヒストグラム均一化の適用や、アンシャープマスクによるシャープネス調整など、より高度な画像処理もやってみたいと思います。

Acroquest Technologyでは、キャリア採用を行っています。

ディープラーニング等を使った自然言語／画像／音声／動画解析の研究開発

Elasticsearch等を使ったデータ収集／分析／可視化

マイクロサービス、DevOps、最新のOSSやクラウドサービスを利用する開発プロジェクト

書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長

　少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。 www.wantedly.com