关键时间点
- 2023-02:LLaMA 1 发布
- 2023-07:LLaMA 2 + 可商用许可
- 2024-2025:Qwen / RWKV 等中文场景友好的模型持续迭代
- 2025-06:RWKV-World 5.0 稳定版发布,7B 可在消费级 GPU 实时推理
为什么这件事对普通人重要
- 成本不再是障碍:部署一个足够处理『摘要、润色、检索』的模型,成本低到几乎可以忽略
- 隐私友好:你第一次可以在完全不联网的机器上用 AI
- 可定制:你可以针对自己的业务做进一步微调
一个判断工具
我做过一个简单的测试:在 10 个你日常高频的任务上,同时用开源模型和云端模型跑一遍,记录『质量 × 速度 × 成本』。你会发现,对大量『简单但重复』的任务,开源模型已经足够。