开源模型的代码能力追上 GPT-4

发生了什么

2026 年 Q1，开源模型的代码能力有一个明显的"追上"。

最关键的几个指标是 HumanEval（代码理解）和 MBPP（写代码）。

几个有代表性的结果：

数字不是"完全追上"，但差距缩小到了可用级别。

这是第一次，你可以在花几百块租一台单机，本地跑一个"几乎和 GPT-4 一样强"的代码模型。

“开源"不代表"免费商用完全免费

但：

真正的差距是在语言能力仍然在**生态支持

一句话，而不是代码能力。

未来 12 个月内，“代码能力"这个词对所有人都会有一次大洗牌。

谁能在**本地、隐私保护、低延迟、低价格这几个维度上占优，谁就是开发者的新宠。

“强模型 + 本地部署 + 中文场景的组合会成为 2026 的重要趋势之一。