示例内容
AI PRACTITIONER · BLOG

为什么我不再追『最强模型』了

过去一年我花了大量时间比较各家模型谁更强。现在我基本不做这件事了。原因写在这篇里。

我之前是怎么想的

过去两三年,跟很多人一样,我对『哪家模型最强』非常敏感。

每次一个新模型发布,我会第一时间下载评测基准,跑一遍,记录排名。我把『更强 = 更值得用』当作默认前提。

我慢慢意识到的几件事

1. 大多数日常任务,各主流模型之间的差距远小于『你有没有好好写提示』

这是我最大的一个认知变化。同样一个任务,换一个清楚的 Prompt 带来的提升,远大于从模型 A 换成模型 B

换句话说,如果你觉得某个模型"不够好",大概率问题出在你怎么用它,而不是模型本身。

2. 模型的『稳定性』比『最强性能』重要得多

我试过很多次:一个模型在某个评测上排第一,但在我的真实任务上『有时候对有时候不对』。

对一个要嵌入日常流程的工具来说,稳定可预期 > 偶尔惊艳。我宁可要一个每次都给我 80 分的工具,也不要一个有时候 99 分、有时候 50 分的工具。

3. 真正决定你效率的,是你有没有『一套能反复跑的流程』

而不是你有没有用『当下最强的模型』。

流程一旦建立起来,换模型是一件相对轻松的事。但如果只有最强模型、没有流程,你每次用 AI 都得从头想『我该让它做什么』,长期下来反而更慢。

我现在的策略

  • 只保留 2-3 个主流模型,够用就行,不追新
  • 把注意力放在『怎么把任务写成可重复的脚本』
  • 每周做一次『这套流程实际帮我省了多少时间』的评估,用真实数据而不是感觉来判断

最后一句话

AI 不会让你更快。对 AI 的使用方式会让你更快。

把注意力从『哪个模型更强』转移到『我能不能把这件事写成一个可被重复执行的流程』,长期来看,后者的回报会高得多得多。