为什么我不再追『最强模型』了

我之前是怎么想的

过去两三年，跟很多人一样，我对『哪家模型最强』非常敏感。

每次一个新模型发布，我会第一时间下载评测基准，跑一遍，记录排名。我把『更强 = 更值得用』当作默认前提。

这是我最大的一个认知变化。同样一个任务，换一个清楚的 Prompt 带来的提升，远大于从模型 A 换成模型 B。

换句话说，如果你觉得某个模型"不够好"，大概率问题出在你怎么用它，而不是模型本身。

我试过很多次：一个模型在某个评测上排第一，但在我的真实任务上『有时候对有时候不对』。

对一个要嵌入日常流程的工具来说，稳定可预期 > 偶尔惊艳。我宁可要一个每次都给我 80 分的工具，也不要一个有时候 99 分、有时候 50 分的工具。

而不是你有没有用『当下最强的模型』。

流程一旦建立起来，换模型是一件相对轻松的事。但如果只有最强模型、没有流程，你每次用 AI 都得从头想『我该让它做什么』，长期下来反而更慢。

AI 不会让你更快。对 AI 的使用方式会让你更快。

把注意力从『哪个模型更强』转移到『我能不能把这件事写成一个可被重复执行的流程』，长期来看，后者的回报会高得多得多。