Codex 给了四个模型,价格差了一个数量级。大部分人的选择是:默认用旗舰版。理由也合理——用最好的省事。
但用久了你会发现,大部分日常任务根本不需要旗舰版的智力。
OpenAI 官方文档的原话是:不确定用哪个,就用 gpt-5.5;优化延迟和成本的,选 mini 或 nano。这话没错,但没说透。下面直接给结论。
完整参数对比
| 模型 | 输入价 | 输出价 | 上下文 | 延迟 | 知识截止 |
|---|---|---|---|---|---|
| gpt-5.5 | $5 | $30 | 1M | Fast | 2025-12-01 |
| gpt-5.4 | $2.50 | $15 | 1M | Fast | 2025-08-31 |
| gpt-5.4-mini | $0.75 | $4.50 | 400K | Faster | 2025-08-31 |
| gpt-5.4-nano | 最低 | 最低 | - | 最快 | - |
旗舰版输出价是 mini 的 6.7 倍。用旗舰做日常任务,相当于花 7 倍的钱干同样的活。
我的分法:按出错成本选模型
别人按"简单/复杂"分,我觉得不够准。应该按出错代价来分。
高风险用旗舰(gpt-5.5)。 代码审查、架构决策、安全相关——出错代价大,多花钱买确定性。
中风险用 mini(gpt-5.4-mini)。 日常编码、文档生成、内容整理——做错了改就行。mini 的速度更快,上下文 400K 也够用。
零风险用 nano。 分类、排序、格式转换——纯粹体力活,交给最便宜的。
核心思路:把预算集中在不能出错的地方。
一个反直觉的发现
我用 mini 和旗舰分别跑过同一批日常编码任务,结果差异不大。mini 的代码质量能到旗舰的 85% 以上,但价格只有 1/7,速度还更快。为 15% 的边际提升支付 7 倍溢价,这笔账不划算。
旗舰版留给那些 mini 确实搞不定的事:复杂推理、多步骤规划、需要深度理解的业务逻辑。剩下的,mini 足够。
一句话
默认用旗舰不是省事,是在浪费钱。把任务按出错成本分级,贵的只在刀刃上用。