AI | Liuji's Blog

Google Gemini 2.5 Flash 发布：最快推理模型，思考可关可开

Gemini 2.5 Flash 把推理做成了可调节旋钮：思考预算设为 0 就是纯速度模式，设到 24576 token 就是深度推理——同一模型，你决定踩多深。

o3 mini 定价 $1.10/百万 token，是 o1 的 1/13，数学测试还打赢了 o1。OpenAI 用这一刀把推理模型的价格锚点永久性地移了。

Anthropic 推出 Projects 记忆功能，把 prompt 工程的隐性成本从用户侧转移到平台侧——AI 终于开始记住你了。

AWS 官方推出 agent-toolkit-for-aws，用经过测试的 Skills + 企业级安全 MCP Server 解决 Agent 进生产环境的核心卡点——其他云厂商还没认真做这件事。