据科技媒体TestingCatalog 6月19日报道,OpenAI有望于6月22日至28日推出其新一代旗舰模型GPT-5.6。尽管X平台有消息称因内部问题可能推迟,但预测市场Polymarket此前曾将该窗口发布概率推高至八成,相关合约交易额已超100万美元。
OpenAI首席科学家Jakub Pachocki已在内部表示,GPT-5.6是对GPT-5.5的“有意义的改进”。部分ChatGPT Pro用户已接触到早期测试版本,反馈显示在相同提示下输出质量明显提升。此外,OpenAI Codex后端日志中也曾短暂出现“gpt-5.6”标识。
从语言模型到可执行Agent
GPT-5.6最受关注的升级在于其强化的Agent化能力。上下文窗口从100万tokens扩展至约150万tokens,提升约43%;词元效率再提高10%至15%,意味着单位成本可处理更多任务。
据泄露测试反馈,GPT-5.6已支持三项关键功能:视觉复刻(将设计稿直接转为可运行代码)、SVG 3D对象生成(支持浏览器内旋转与缩放),以及Playwright浏览器自动化(可真实执行点击、输入、页面跳转等操作)。这些能力使其不再仅是提供建议的对话模型,而是具备在用户设备上直接执行任务的能力。
X平台网友形象评论:“GPT-5.6脑子还是那个脑子,但他已经长出手了。”wavespeed.ai报道称,在智能体编码(agentic coding)场景中,GPT-5.6表现已优于Anthropic的Mythos系列,SVG生成能力亦超越Claude Fable 5。此外,GPT-5.5中存在的对齐问题(如reward hacking)也在新版本中得到修复。
价格战打响,定价或为竞品1/3
在商业策略上,GPT-5.6或将成为OpenAI对Anthropic发起价格战的关键武器。据媒体报道,其token价格可能仅为Claude Fable 5的约三分之一,延续并扩大当前OpenAI约为Anthropic一半的定价优势。
分析指出,在性能持平甚至领先的前提下,大幅降价将加速企业客户向OpenAI平台迁移,进一步压缩竞争对手的市场空间。当前,AI大厂迭代节奏明显加快:GPT-5.4至GPT-5.5间隔约六周,GPT-5.6或延续这一高频更新策略。同期,Anthropic的Fable 5、Opus系列及Google Gemini亦密集更新,社区已将6月下旬称为“AI大事件周”。
用户泼冷水:5.6仅为小迭代,突破待GPT-6
近期,多名用户反映GPT-5.5出现“降智”现象,猜测OpenAI正在后台测试GPT-5.6。有用户称:“我认为他们在测试5.6,这就是Codex现在这么蠢的原因。”中文X用户也吐槽:“GPT-5.5绝对这两天是降智了……如果你三天内不出GPT-5.6我就不原谅你了。”
然而,Reddit社区提醒外界降低预期。有用户指出,5.6仅为小版本迭代,参数规模不会大幅跃升:“Fable之所以有自己的版本号(而不是Opus 4.9),是因为它是一个新版本,而5.6应是旧版本的迭代。”另有分析称,Claude Fable约为6T级模型,GPT-5.5约2T级,GPT-5.6预计不会在参数量上实现2-3倍跳跃,“真正的模型级别跃升需等待GPT-6”。
