Liuji's Blog

开源大模型将在 2026 年 12 月追上闭源？数据说的不是一件事

有分析预测开源大模型将于 2026 年 12 月追上闭源——但这个结论只发生在 coding 任务上。同一份数据，不同维度给出截然相反的答案。

2026 年 2 月，AWS 推出 Lambda Durable Functions，通过 checkpoint/replay 机制让整个工作流最长可跑 1 年，等待期间不计费。这是 serverless 为 AI agent 工作流重新设计的信号。

Weave Router 是一个代理层，插在 coding agent 和模型之间，50ms 内动态路由每条请求到最合适的模型。内部实测省了 40% token 成本，质量无明显差异。

Lambda Durable Functions 让整个工作流最长可跑 1 年，等待期间不计费——AWS 直接点名这是给 AI agent 工作流设计的。

有数据说开源 12 月就追上闭源，有数据说差距稳定在 5 个月。同一份数据，两个截然相反的故事——取决于你更在意哪件事。

GPT-5.6 Sol 和 Mythos 同一天发布，但两家公司都说了同一件事：能不能用，美国政府说了算。AI 访问权正在变成一种新型国家资源。

Gemini 2.5 Flash 把推理做成了可调节旋钮：思考预算设为 0 就是纯速度模式，设到 24576 token 就是深度推理——同一模型，你决定踩多深。

o3 mini 定价 $1.10/百万 token，是 o1 的 1/13，数学测试还打赢了 o1。OpenAI 用这一刀把推理模型的价格锚点永久性地移了。

Anthropic 推出 Projects 记忆功能，把 prompt 工程的隐性成本从用户侧转移到平台侧——AI 终于开始记住你了。

AWS 官方推出 agent-toolkit-for-aws，用经过测试的 Skills + 企业级安全 MCP Server 解决 Agent 进生产环境的核心卡点——其他云厂商还没认真做这件事。