本周 ChatGPT 中感觉有些不同,很多人立刻注意到了。
在 X 中,测试人员过去两天交换了屏幕截图和秒表时间,所有这些都指向一个理论:OpenAI 正在 ChatGPT 内悄悄地 A/B 测试 GPT-5.6,并替换了一些选择 GPT-5.5 Pro 的用户。
开发者 Anshu Chimala 周四发布了一段并排视频,比较一次性登陆页面,并配上标题:“好吧好吧,我是早期拥有 GPT-5.6 Pro 访问权限的幸运者之一。”
Well well well, I'm one of the lucky ones with early GPT-5.6 Pro access!
One-shot pages from 5.5 Pro vs 5.6 Pro. Can you tell which is which? Looks like OpenAI's finally getting somewhere with design: pic.twitter.com/xghxmsANMG
— Anshu (@anshuc) June 19, 2026
开发人员 Dobroslav Radosavljevič 在 X 上发布表示,无论他在 OpenAI 的编码代理 Codex 中运行什么,“感觉与 5.5 模型完全不同”。下面的回复分为信徒和称其为安慰剂的人。
这些帖子中最清晰的模式是时间。 Conor Dart 是众多放大谣言的 X 用户之一,他使用一款带有物理和摄像头控制的单提示 3D 浏览器游戏进行了测试,该游戏只花了一个多小时就生成了,而 GPT-5.5 Pro 通常需要 10 分钟。
“虽然并不完美,但对于一次性 AI 游戏开发测试来说,这确实令人印象深刻,”Dart 写道。
Possibly GPT-5.6 Pro inside ChatGPT using GPT 5.5 Pro....
I ran the same style of game build after testing GLM 5.2, and this honestly felt a lot smoother.
The full game took literally 60 minutes and 15 seconds to create. ( GPT 5.5 Pro always responded with in a 10min mark)
— Conor Dart (@Conor_D_Dart) June 18, 2026
AI 内部人士 Chetas Lua 报告了在测试机器人模拟时出现了类似的减速情况,也非常确定他的结果来自 OpenAI 的新模型:“GPT 5.6 Pro 在 3D 测试中继续拖慢 [Anthropic 的寓言 5],”他写道。 “也致力于游戏的开发。”
在另一篇文章中,他指出响应时间延长至 20 或 40 分钟,他说自 GPT-5.5 发布之前就没有出现过这种情况。
🚨 GPT 5.6 Pro first output on the same prompt
we are getting started
> frontend/ webdev is not solved or improved yet
> but understanding increased a lot
> it started to take 20-40 mins again like it used to do before 5.5 pro https://t.co/zcLehTbe5c pic.twitter.com/C7u6ZRUfjT— Chetaslua (@chetaslua) June 18, 2026
并非所有比较都让传闻中的模型感到满意。 X 上的 AI 基准测试人员 Chris 给两个模型提供了相同的宇宙飞船建造提示——疑似 GPT-5.6 Pro 工作了 87 分钟,而 GPT-5.5 Extra High 工作了 34 分 42 秒。
他写道:“正如我之前所说,基于权威,GPT-5.6 将是对 GPT-5.5 的渐进/坚实改进,而不是《神鬼寓言》杀手。”同时指出《神鬼寓言 5》在飞船的核心几何形状上仍然击败了这两个模型。 “我的粗略预期是,它会在某些基准测试中与《神鬼寓言 5》相媲美,根据类别的不同,可能会赢得一半左右,但总体上不会明显超过。”
另一篇由泄密者 Pankaj Kumar 发表的文章详细泄密更进一步:知识截止日期被推迟到 2025 年 12 月,一些测试人员称之为“果汁值”的推理努力设置据称从 768 提高到 960,SVG 和 3D 设计生成能力足以在某些方面击败《神鬼寓言 5》任务。
这些内容都不是来自 OpenAI,但各个帐户的细节是一致的:更强的推理、未完成的前端以及绰号为 Kindle-Alpha 的候选版本。
一位名为 Leo 的 AI 影响者援引未透露姓名的消息来源在帖子中写道,该可疑模型“现在正在 ChatGPT 中选择 5.5 Pro 时进行隐形测试”,至少对于某些 Pro 帐户而言是这样,计划于下周四(6 月 25 日)公开发布。
If you're wondering how people on your timeline seem to have access to GPT-5.6 Pro, it's now being stealth tested when 5.5 Pro is selected in ChatGPT (*at least for some Pro accounts)!
I have also been told next Thursday is the planned launch date for 5.6
— leo 🐾 (@synthwavedd) June 18, 2026
最接近 OpenAI 指纹的东西是备忘录,而不是推文。据 The Information 报道,首席科学家 Jakub Pachocki 告诉员工,下一个模型是对 GPT-5.5 的有意义的改进。这仍然不是对 A/B 测试、发布日期或任何围绕 X 的规范的确认,但它确实确认了新模型已经在酝酿之中。
Decrypt联系 OpenAI 询问 GPT-5.6 是否正在 ChatGPT 内进行测试,但截至发稿时该公司尚未做出回应。
为什么 OpenAI 可能很匆忙
如果 OpenAI 急于推出一款新的旗舰机型,它是有理由这样做的。中国的开源模型 GLM-5.2 在 FrontierSWE 上仅落后 Claude Opus 4.8 一个百分点(FrontierSWE 是一个根据主导率对多小时、开放式工程项目上的人工智能代理进行评分的基准),同时在同一测试中完全击败了 GPT-5.5。
与此同时,Anthropic 正在应对自身造成的损害。该公司的旗舰产品《神话 5》和《神鬼寓言 5》仍然受到美国 6 月 12 日因有争议的越狱漏洞发布的出口管制指令的管制,从而在市场顶部留下了一个空白,GLM-5.2 和假设的 GPT-5.6 都可以填补。
如果 Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei) 与唐纳德·特朗普 (Donald Trump) 总统达成和解,那么《神鬼寓言 5》将比目前任何其他模型都强大得多,Anthropic 顶级模型与 OpenAI 之间的质量差距将比以前更大。
桌上还有钱。据《华尔街日报》报道,据《华尔街日报》报道,OpenAI 正在权衡降价向开发商和企业收取的代币价格,预计 Anthropic 在两家公司准备进行 IPO 时也会采取同样的做法。
其中任何一项是否构成实际的 GPT-5.6 版本只有 OpenAI 才能确认,并且该公司在检查点泄露和隐形测试声明一周后一直保持沉默。然而,Polymarket 交易者并没有坐以待毙,6 月 22 日至 6 月 28 日期间推出的合约本周定价高达 89%。
