OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？

4月5日讯 当地时间周五，OpenAI首席执行官奥尔特曼表示，将在未来几周内发布o3和o4-mini，未来几个月将发布GPT-5。
奥尔特曼当天在社交媒体上发文称，GPT-5的发布比预期要晚，但这是有原因的，最令人兴奋的是，现在有能力把GPT-5做得比最初预期的要好不少。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-1.jpg

“我们还发现，顺利整合所有内容比我们预想的要困难得多。而且我们希望确保有足够的能力来支持我们预期的前所未有的需求。”这说明OpenAI预计GPT-5发布后会非常受欢迎，可能会有大量的用户使用，所以他们需要提前做好准备。
近期以来，随着ChatGPT的全新图片生成功能引发互联网狂欢，OpenAI的活跃用户数、应用内订阅收入，以及下载量均创下历史新高。据悉，ChatGPT的付费用户数量已经突破2000万人，去年底时这个数字为1550万人。
o3和o4-mini的技术规格尚未公开，但预计它们将填补GPT-4与即将到来的GPT-5之间的能力差距。行业观察人士认为，GPT-5将在推理、规划和记忆功能方面有显著改进。
OpenAI此前在公布有关GPT-5的细节时提到，公司打算以“标准智能设置”为用户提供对GPT-5的无限聊天访问权限，但会受到“滥用阈值”的限制。ChatGPT Plus用户将能够以“更高智能水平”运行GPT-5，而ChatGPT Pro用户将能够以“更高一级的智能水平”运行GPT-5。
奥尔特曼在今年早些时候透露：“GPT-5将整合语音交互、画布(Canvas)、深度搜索、深度研究等功能。”他提到的是OpenAI在过去几个月中在ChatGPT中推出的一系列功能。他还表示：“我们的一个重要目标是通过创建能够使用我们所有工具的系统，能够判断何时需要深入思考、何时不需要，并且能够广泛应用于各种任务，来统一我们的大模型。”
与此同时，OpenAI正面临来自竞争对手日益增长的压力，这些竞争对手采用了“开放”的方式来推出模型，例如中国的AI实验室DeepSeek。与OpenAI的策略不同，这些“开放”的竞争对手将他们的模型提供给人工智能社区用于实验，在某些情况下还用于商业化。
不过就在近日，奥尔特曼也宣布OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重(open-weight)模型”。该模型将具有推理能力，并将接受额外的安全评估。

发表于 2025-4-8 10:49:37

O3估计也就是O1+++，不会有太多新功能，看奥特曼的说法，Gpt5也只是O家之前各种功能的集大成之作。而且我很怀疑O3能不能比Gemini2.5Pro好用，毕竟Gemini的上下文和多模态实在是太强了。
O家要危啊，这个上半年算是被围剿了——X家的Grok3,A家的Claude3.7sonnet合力逼出一个Gpt4.5，这次Google的Gemini2.5Pro又逼出来原计划不单独发布的O3。不过Claude4出来O家怎么办呢？Gpt5还是O4？啊对，还有D家的V4和R2，这两个不一定能做到SOTA，但绝对能狠狠给O家这个吃相上一课。
下半年估计更有乐子，看Grok3的情况，X家的20W卡搞出来的Grok4性能不会太差，至少是T1梯队，Google的Gemini3也是很值得期待的。
今年绝对是非常有活的一年，很有可能下半年就会有能独立完成（无需人类干涉）大型项目的模型出来了，很期待那一天。当然，我更期待国产模型能达到T1甚至T0梯队，现在Deepseek V3/R1的可用性还是不高，期待V4/R2（不考虑本地部署的情况下，Qwen还是算了吧，榜单战神）

发表于 2025-4-8 11:01:37

是这样的：
1）原本OAI说的是GPT-4.5以后就不区分GPT-4/5和GPT-o系列了，统称为GPT-5，这样：
a）原本1月份发布的GPT-3期货，不会单独拿出来发了，只是内部使用和用在DR里；
b）不会有新的o系列了，GPT-4.5之后就是GPT-5；
c）1个多月前说GPT-5是a few month，原本大家是抓5月底发的。
2）现在按照他新的说法：
a）GPT-5还是a few month，跟5月底发的预期不太匹配；
b）GPT-o3和GPT-o4 mini说明他短时间内拿不出新货，只能用这种本来不准备发的东西应付，这个跟发掉GPT-4.5的逻辑一样；
c）过往GPT-o3 mini跟GPT-o1性能是一致的，类比GPT-o4 mini跟GPT-o3性能应该是一致的，也就意味着未来几周的发布不会推进智能的边界。
3）说明了什么：
a）GPT-5训练可能不顺利，mark chen有可能融合推理和预训练模型的时候失败了；
b）未来几周有可能会有新的模型，OAI在恶心人，大概率狙击的是LLAMA 4，Grok跟deepseek大概率也会狙击LLAMA。

发表于 2025-4-8 11:11:28

这里OpenAI提到的o3以及GPT-5之前已经是发了预告，唯一的新品是o4-mini。

o3其实在去年“OpenAI 12天活动”的第12天已经发布了。o1是第一个基于强化学习训练的大型推理模型，而o3进一步扩展了（scaling）强化学习来提升模型效果。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-2.jpg

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-3.jpg

o3在编程以及数学方面，相比o1均有明显提升。比如，o3在真实世界编程基准SWE-bench Verified上实现了71.7%的准确率，比o1高出20%；o3在Codeforces上的得分已经达到了2727 ELO，在全球排名中名列第175位，这已经超过了网站中的99.9%的人类选手。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-4.jpg

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-5.jpg

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-6.jpg

而且o3还在一个ARC-AGI测试上取得了突破。在 10,000 美元计算限制下的半私有测试集上取得了突破性的75.7% 的成绩，取得了公共排行榜第一。而在高计算配置下，o3 得分为87.5%。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-7.jpg

OpenAI 最强推理模型 o3 发布，AGI 测试能力暴涨，会对哪些领域带来影响？不过o3一直是没有对外正式发布，但在今年1月底上线了o3-mini[1]。
OpenAI 上线推理模型 o3-mini，首向免费用户开放推理，体验如何？有何技术亮点和新应用场景？o3-mini按照推理强度（推理思维链长短）分为low、medium和high三档，其中o3-mini low效果超过o1-mini，o3-mini medium性能和o1相当，而o3-mini high超过o1。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-8.jpg

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-9.jpg

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-10.jpg

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-11.jpg

所以o3-mini应该是OpenAI线上最强的推理模型，大号版本o3应该能超过它。而我比较期待的是o系列的下一个版本o4，看来OpenAI还是先推出mimi版本o4-mini，o4如果能继续提升明显，那么说明推理模型的test-time inference scaling还是有搞头的。
而对于GPT-5，今年2月份的时候奥特曼也已经透露过了。OpenAI在发布GPT-4.5之后会发布GPT-5：

In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3. We will no longer ship o3 as a standalone model

OpenAI 放王炸，将发布整合多项技术的 GPT-5，并免费无限使用，该模型有哪些技术亮点？当时的说法，GPT-5会集成OpenAI很多技术，包括o3，而且说o3不会作为一个单独的模型发布。
但是现在看来，o3应该是提前于GPT-5单独发布。而且GPT-5可能比预期更好，但基本确定是延迟发布了。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-12.jpg

不过之前奥特曼说GPT-5会直接集成到ChatGPT了，没有订阅ChatGPT会员的用户也可以免费使用。如果真正推出的时候会是免费的，效果强于现在免费的GPT-4o的话，那么就很有用了。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？-13.jpeg

https://www.zhihu.com/video/1891866596919715006

发表于 2025-4-8 11:22:06

某种程度上，反应了当今大模型领域日新月异的竞争压力。而这种竞争压力的直接来源我认为很可能是谷歌前几天发布的gemini2.5pro
按照奥特曼在2月的设想，o3将和gpt4.5一起，被整合到gpt5中，那时候估计gpt5会在5月份发布，可以参考gpt3.5到gpt4的发布时间，gpt4.5显然只是一个过渡时期的模型，并没有打算做多模态，上个月还在更新gpt4o，更新后的性能直超gpt4.5，再加上昂贵的价格，可见gpt4.5只是临时被推出来，做一个过渡时期的模型，真正的主菜应该是不久后推出的gpt5
但最近几个月大模型领域竞争过于激烈，先是deepseek r1在国内外爆火，open ai同期发布了o3 mini模型，grok3和claude3.7的推出open ai又匆忙发布了gpt4.5，谷歌发布gemini2.5pro又使得open ai推出了gpt4o的更新。接下来各家还会有新模型，而且，都在卷推理模型，包括即将发布的r2和qwen3，如果奥特曼只是用去年12月研发的o3，配上那个所谓情感深度的gpt4.5，昂贵的api价格我发誓会被其他家的纯推理模型锤的很惨，尤其是deepseek和gemini，在这种情况下，虽然之前计划要简化命名，但还是得硬着头皮单独发布o系列的模型。而且我觉得，o4系列应该早就已经研发了，只是之前可能想着是gpt5.5或者gpt6用的，现在单独推出来，用升级版的o3暂时和对手竞争，gpt5也会迎来相关的升级，推理部分应该是用o4了，当然，时间也会推迟几个月，估计至少要等到7月之后才能和大家见面了
今年下半年可以期待一波GPT5，Claude4，Grok4以及已经追赶上来的谷歌的Gemini3四家产品同台亮相。国内的话，看deepseek是否也会尝试整合v4和r3模型推出新的产品，总之，下半年基本聊天、推理领域就卷到人类目前水平的尽头了，今年开始逐渐卷新的赛道是agent，接下来几年还会卷创新，组织，这些都完成了的时候，agi就真的来临了

发表于 2025-4-8 11:31:59

我看有人在吹 GPT-5，我咋觉得恰恰相反。我看完之后的感觉是，这一切都在为 GPT-5 的训练遇阻和发布延后做找补。简单来说，推理模型和非推理模型的融合遇到了困难，但推理模型本身还没有遇到瓶颈。
我们首先要理解 OpenAI 的「计划有变」是怎么个变法，比较重要的信息就在 Sam Altman 前后发的两条推特里。
之前的计划（2月13日）是[1]：

简单来说就是

发布 GPT-4.5 作为最后一个非思维链模型（现在已经发布）
将整合所有工具、思考、功能，统一 o 系列和 GPT 系列，数月内推出 GPT-5
不再单独发布 o3
免费用户将可以无限制使用 GPT-5
付费用户可以以「更高智力水平」运行 GPT-5，并使用各种高级工具

看上去似乎比较混乱。实际上 OpenAI 的模型现在就是两条路线：

推理模型（去年 9 月之后）：o1/o1-mini → o3/o3-mini（o3 之前已经发布了，但 OpenAI 并没有实际上面向用户推出，据说是消耗算力的成本过高）
非推理模型：GPT-3.5 → GPT-4 → GPT-4o（多模态） → GPT-4.5（传闻中的 Orion，也是最后一代非推理模型）→ GPT-5（融合所有能力）

而现在 OpenAI 的计划是[2]：

依然会发布 o3 和 o4-mini（也许在几周内）
几月之后发布 GPT-5，能够将 GPT-5 训练得比最初预想的效果更好
整合所有能力比预计的更难
希望得到更多容量（算力）来支持

首先是大家最关心的 GPT-5，出现了自相矛盾的描述。一方面说 GPT-5 会效果更好，另一方面又说整合所有事情比预想的更难。
因为最初 GPT-5 的主要目的是整合推理和非推理两条路线的模型，以及各种模态和工具能力。现在说「整合遇到困难」，实际上就是承认 GPT-5 的训练不及预期。
考虑到大模型行业现在你追我赶的迭代速度，如果真的延期三个月，别家就会迭代出小版本，所以才会补偿性地承诺出「GPT-5 会效果更好」。
同样，由于 GPT-5 短期内拿不出来，或者说 GPT 系列已经遇到了显著的瓶颈（否则去年也不会去折腾推理模型），所以 OpenAI 发现自己模型发布之间的空档期过久（GPT-4.5 已经推出了，虽然成本很高），所以他们需要别的东西来填补中间的空挡，给用户一种他们依然技术领先的感觉。
于是之前不打算发布的 o3 被迫拿了出来，又画了一个 o4-mini 的饼。
o3 的成本目测会持平/高于 o1 pro。换句话说，o3 也许会像 GPT-4.5 一样，成本高到失去实际上的可用性，因为大家都用不起。
一个例证在于，ARC-AGI 去除了 o3-high 的分数，他们将最初 o3-low 的估算从每任务 20 美元提高到每任务 200 美元。推测 o3-high 从每任务 3,000 美元提高到每任务 30,000 美元，由于成本突破了每任务 10,000 美元的限制，o3-high 不再被包括在内[3]。

至于 o4-mini，往好处想，这说明推理模型暂时还没有到上限，依然能有能力突破（至少是测评分数的提升）。
现在 OpenRouter 上出现了一个神秘的匿名模型 Quasar Alpha[4]（目前免费可用），OpenRouter 官方称：这是一个提供给社区以收集反馈的“披露受限”模型。它是一个功能强大、用途广泛的模型，支持包括代码生成在内的长上下文任务。该模型的所有提示词和生成内容都会被提供方以及OpenRouter记录。

实际测试的话，Quasar Alpha 会承认自己来自 OpenAI：

而且 Quasar Alpha 有另外几个印象非常深刻的优点，第一是快，第二是上下文长，第三是性能似乎还不错。
实际测试中，Quasar Alpha 往往能提供超过 100 tokens/s 的速度，数倍高于其他模型（考虑到速度往往和模型尺寸、价格强相关，可以推断 Quasar Alpha 也许模型不大，且未来定价不高）；按照 OpenRouter 的标注，Quasar Alpha 支持 1M tokens 上下文；一些网友给出的测评分数中，Quasar Alpha 超过了 o3-mini 和 Claude 3.5.

综合以上信息，很多人都在猜 Quasar Alpha 会不会就是 o4-mini，毕竟 OpenAI 目前已经预告的短期之内可能会发布的新模型就剩下 o4-mini 了。
但我个人倒是感觉不太可能，因为 Quasar Alpha 显然不是一个推理模型，更有可能是 GPT 系列。而且不论怎么说，这些和 GPT-5 都没关系，都是在为 GPT-5 的延期找补。
以上。

OpenAI 将在几周内发布 o3、o4-MINI，未来几个月发布 GPT-5，会带来哪些新功能？

本周热门