先日、OpenAIから、公式のプラグインとして発表された「Code Interpreter」ですが、 趣味の写真でもなにか使えないかと思い、画像処理を試してみることにしました。
Code Interpreterの概要や有効化の方法は前の記事をご覧ください。
以前撮影した、富士山の写真から、Zoomの仮想背景に使うことを想定し、色々と加工させてみたいと思います。
画像処理/加工
今回、以下のような画像処理/加工を実施してみました。
画像サイズの確認
まずは画像のサイズを確認します。
これくらいはお手の物。写真アプリで確認したサイズとも一致しています。
画像をFullHDサイズにする
元の画像のサイズ(5392px × 3592px)は、仮想背景として使うには、大きすぎます。
アスペクト比も、24 : 16 というサイズなので、16:9にしておきたいです。
Code Interpreterにお願いしてみます。
期待どおり、クロップしてくれました。
画像の明るさと彩度を調整する
さて、今の画像は暗くなっているので、明るくかつ彩度も上げて印象をよくしてみたいと思います。
こちらも期待通りの結果になりました。
指定の形で切り抜く
当初、Zoomの仮想背景に使う予定でしたが、SNSのアイコンにも使いたくなりました。
SNS用に、丸で切り抜いてもらいました。
いい感じになったと思います。
データをダウンロードする
これまで加工してもらった画像をダウンロードします。
Code Interpreterにお願いしたところ、丸に切り抜いたものは、JPEGで保存しようとしてエラーが起きたので、 代わりにPNGで保存するよう、Code Interpreter自身でやり直す判断をしています。
まとめ
サイズの変更や図形での切り抜きなど、簡単でもやると面倒な加工は、Code Interpreterにお任せできそうです。
複数画像がある場合は、zipにまとめて一気に処理させても良さそうです。
また画像処理については今回、明るさ・彩度は単純に上げてもらうだけでした。 次回は、ヒストグラム均一化の適用や、アンシャープマスクによるシャープネス調整など、より高度な画像処理もやってみたいと思います。
Acroquest Technologyでは、キャリア採用を行っています。少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。 www.wantedly.com
- ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
- Elasticsearch等を使ったデータ収集/分析/可視化
- マイクロサービス、DevOps、最新のOSSやクラウドサービスを利用する開発プロジェクト
- 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長