Google Gemini 2.5 Flash 发布:最快推理模型,思考可关可开

Gemini 2.5 Flash 把推理做成了可调节旋钮:思考预算设为 0 就是纯速度模式,设到 24576 token 就是深度推理——同一模型,你决定踩多深。

June 26, 2026 · 1 min · 汤姆的技术雷达

OpenAI 推出 o3 mini:最便宜的推理模型,性价比碾压前代

o3 mini 定价 $1.10/百万 token,是 o1 的 1/13,数学测试还打赢了 o1。OpenAI 用这一刀把推理模型的价格锚点永久性地移了。

June 26, 2026 · 1 min · 汤姆的技术雷达