AgentKit 值得看,但别把它想成一个万能搭子。它更像一套把 agent 拼起来的工程件,不是替你省掉判断的捷径。
我看 OpenAI 这套 Agent 工具,真正上头的点不是它又发了几个新名词,而是它终于开始认真解决 agent 最脏...
Deep Research 值钱的地方,从来不是“会搜”,而是能不能替你把一团乱资料先收拢成能判断的东西。
GPT-4.1 不是拿来陪你闲聊的,它更像开发者手里一把更顺手的刀。你如果看错方向,就会觉得它没那么惊艳。
GPT-5.4 这次让我在意的,不是它又强了多少,而是 OpenAI 已经越来越像在卖一套工作能力,不是一个聊天模型。