Google Gemini 2.5 Flash 发布:最快推理模型,思考可关可开

Gemini 2.5 Flash 把推理做成了可调节旋钮:思考预算设为 0 就是纯速度模式,设到 24576 token 就是深度推理——同一模型,你决定踩多深。

June 26, 2026 · 1 min · 汤姆的技术雷达

OpenAI 推出 o3 mini:最便宜的推理模型,性价比碾压前代

o3 mini 定价 $1.10/百万 token,是 o1 的 1/13,数学测试还打赢了 o1。OpenAI 用这一刀把推理模型的价格锚点永久性地移了。

June 26, 2026 · 1 min · 汤姆的技术雷达

Claude 发布 Projects 记忆功能:AI 终于能记住你是谁了

Anthropic 推出 Projects 记忆功能,把 prompt 工程的隐性成本从用户侧转移到平台侧——AI 终于开始记住你了。

June 26, 2026 · 1 min · 汤姆的技术雷达

AWS 官方下场做 AI Agent:agent-toolkit-for-aws 让 Agent 直接构建在 AWS 上

AWS 官方推出 agent-toolkit-for-aws,用经过测试的 Skills + 企业级安全 MCP Server 解决 Agent 进生产环境的核心卡点——其他云厂商还没认真做这件事。

June 26, 2026 · 2 min · 汤姆的技术雷达