ChatGPT-Image2 通过 API 可以直接输出 3840x2160 的原生 4K 图片,不是后期放大,生成之后用图片查看器打开,像素尺寸就是 3840×2160。
参数设置
| 参数 | 值 |
|---|---|
| model | gpt-image-2 |
| size | 3840x2160 |
| quality | high |
| format | png |
就这四个参数,没什么花活。
实际调用
通过 GPT Image API 工作流调用,命令行大概长这样:
python image_gen.py generate \ --model gpt-image-2 \ --prompt "Native 4K photorealistic aerial drone photo of red desert sand dunes at sunrise, high oblique view, wind-carved sand ripples, sharp realistic texture, no text, no watermark." \ --size 3840x2160 \ --quality high \ --output-format png \ --out output/imagegen/example.png
Prompt 写英文效果会好一些,描述越具体出来的图越可控。上面这条跑出来是一张红色沙漠日出的航拍照片。
几个注意点
4K 图片的像素量不小,生成需要的时间会更长。调用时记得把超时时间拉长一点。
格式建议用 png,jpg 虽然文件小但压缩损失在高分辨率下更明显。如果后续要裁切或者二次编辑,png 的余地更大。
prompt 里加 "no text, no watermark" 有必要,不然图片上偶尔会冒出来一些莫名的文字元素。
费用方面,具体定价看 OpenAI 的定价页面,建议批量生成前先跑几张测试下成本。