Google Gemini 2.5 Flash 发布:最快推理模型,思考可关可开
Gemini 2.5 Flash 把推理做成了可调节旋钮:思考预算设为 0 就是纯速度模式,设到 24576 token 就是深度推理——同一模型,你决定踩多深。
Gemini 2.5 Flash 把推理做成了可调节旋钮:思考预算设为 0 就是纯速度模式,设到 24576 token 就是深度推理——同一模型,你决定踩多深。
o3 mini 定价 $1.10/百万 token,是 o1 的 1/13,数学测试还打赢了 o1。OpenAI 用这一刀把推理模型的价格锚点永久性地移了。
Anthropic 推出 Projects 记忆功能,把 prompt 工程的隐性成本从用户侧转移到平台侧——AI 终于开始记住你了。
AWS 官方推出 agent-toolkit-for-aws,用经过测试的 Skills + 企业级安全 MCP Server 解决 Agent 进生产环境的核心卡点——其他云厂商还没认真做这件事。