我之前是怎么想的
过去两三年,跟很多人一样,我对『哪家模型最强』非常敏感。
每次一个新模型发布,我会第一时间下载评测基准,跑一遍,记录排名。我把『更强 = 更值得用』当作默认前提。
我慢慢意识到的几件事
1. 大多数日常任务,各主流模型之间的差距远小于『你有没有好好写提示』
这是我最大的一个认知变化。同样一个任务,换一个清楚的 Prompt 带来的提升,远大于从模型 A 换成模型 B。
换句话说,如果你觉得某个模型"不够好",大概率问题出在你怎么用它,而不是模型本身。
2. 模型的『稳定性』比『最强性能』重要得多
我试过很多次:一个模型在某个评测上排第一,但在我的真实任务上『有时候对有时候不对』。
对一个要嵌入日常流程的工具来说,稳定可预期 > 偶尔惊艳。我宁可要一个每次都给我 80 分的工具,也不要一个有时候 99 分、有时候 50 分的工具。
3. 真正决定你效率的,是你有没有『一套能反复跑的流程』
而不是你有没有用『当下最强的模型』。
流程一旦建立起来,换模型是一件相对轻松的事。但如果只有最强模型、没有流程,你每次用 AI 都得从头想『我该让它做什么』,长期下来反而更慢。
我现在的策略
- 只保留 2-3 个主流模型,够用就行,不追新
- 把注意力放在『怎么把任务写成可重复的脚本』
- 每周做一次『这套流程实际帮我省了多少时间』的评估,用真实数据而不是感觉来判断
最后一句话
AI 不会让你更快。对 AI 的使用方式会让你更快。
把注意力从『哪个模型更强』转移到『我能不能把这件事写成一个可被重复执行的流程』,长期来看,后者的回报会高得多得多。