k8凯发国际OpenAI高管自爆:Scaling不死G|XRK98XYZ会感谢我
详情
GPT-5的能力到底有什么提升与意义?人工智能未来走向何处?这款惊艳亮相的OpenAI新模型★★★◈,如何揭示智能的多种形态?
过去用户必须通过ChatGPT的模型选择器XRK98XYZ会感谢我的★★★◈,手动为不同任务挑选模型★★★◈。提问后XRK98XYZ会感谢我的★★★◈,有时你会选思考模式★★★◈,有时则不会★★★◈。OpenAI认为这种体验说实话容易让人困惑★★★◈。
GPT-5彻底简化了这个流程★★★◈。它不仅自动替你决策★★★◈,本质上也更聪明★★★◈。在写作★★★◈、编程★★★◈、健康等领域★★★◈,它准确性更高★★★◈、响应更快★★★◈,整体体验全面升级★★★◈。
大家本以为GPT-5的智能将爆炸式增长★★★◈,为何OpenAI选择以可用性而非智能提升作为主要卖点?
分配越多的思考时长★★★◈,答案质量就越高——这是基本规律★★★◈。当在特定基准测试中允许模型思考时★★★◈,AI的表现远超现有所有模型★★★◈。
因此★★★◈,这是一次全维度的智能飞跃★★★◈。但关键在于动态分配思考时间的能力——OpenAI认为这才是提升用户体验的核心★★★◈。
现在人类已经进入需要从多维度评估智能的阶段——OpenAI不是在回避问题★★★◈,而是为了说明GPT-5为何如此特殊★★★◈。
在核心能力上★★★◈,它的提升显而易见★★★◈:SWEBench测试得分更高★★★◈,各类学术评估表现更优★★★◈。OpenAI还特别强化了GPT-5在健康领域的基准表现★★★◈。
从GPT-2到GPT-3★★★◈,再到GPT-3到GPT-4★★★◈,主要是利用了当时的Scaling范式k8凯发国际★★★◈。训练规模越大的模型★★★◈,结果就得到更好的模型★★★◈。
这个规律依然成立★★★◈,但现在有了另一类训练方式★★★◈,即后训练(post-training)★★★◈。用更有趣的方式使用测试时计算(test-time compute)★★★◈,几乎像是训练的第二阶段★★★◈。
比如★★★◈,使用工具对整体智能非常重要XRK98XYZ会感谢我的★★★◈。GPT-2和GPT-3在这方面做得不太好k8凯发国际★★★◈。GPT-4在这方面很初级★★★◈。而现在GPT-5内置了这些能力★★★◈,结合了多步骤和更长远的推理过程★★★◈。
既然训练方式开始变化★★★◈,那OpenAI现在是否认为预训练(pre-training)的回报在递减?
而在后训练方面★★★◈,大家才刚开始触及这个新范式的表面★★★◈。o系列模型k8凯发国际★★★◈,即之前的推理模型★★★◈,只是OpenAI开始探索后训练的起点★★★◈。
Brad Lightcap认为未来一两年★★★◈,主要方向是继续在后训练维度上Scaling★★★◈,继续看到显著的收益★★★◈。因为这些收益太明显了★★★◈。所以现在从两个轴向上改进模型★★★◈:预训练和后训练k8凯发国际★★★◈。这会加速创新★★★◈。
算法★★★◈、规模★★★◈、计算力和数据★★★◈,这些都缺一不可★★★◈。展望未来★★★◈,OpenAI它们都超级重要★★★◈,需要全方位发力★★★◈。
最难的部分当然是让它们完美融合★★★◈。训练更大的模型★★★◈,通常意味着你得用更多数据和计算力★★★◈。这是个微妙的平衡★★★◈,因为单纯放大规模★★★◈,不一定总能带来同等的进步★★★◈。你得把其他元素也带上★★★◈。
这听起来就像他想象中的AGI★★★◈。他似乎想叫它 AGI★★★◈,但OpenAI又没有明确这样说★★★◈。所以★★★◈,为什么GPT-5不是AGI?
OpenAI看待AGI的方式是★★★◈,AGI是个积累过程★★★◈,是个系统★★★◈。你得定义这个系统是什么★★★◈,你期待它能做什么★★★◈。
对Brad来说★★★◈,至少★★★◈,AGI是一个能稳定学习新事物(哪怕超出其训练分布)的系统k8凯发国际★★★◈,这种能力源自它的推理★★★◈、思考★★★◈、解决问题★★★◈、使用工具以及提出新想法的能力★★★◈。但他不认为GPT-5就是AGI★★★◈:GPT-5以及后续模型中★★★◈,开始看到的是这种「通用化学习系统」的部分雏形和模块★★★◈。
而且很难确定AGI和非AGI的分界点★★★◈。即便真有这个时刻★★★◈,也不确定大家会在第一时间意识到★★★◈。因为在和这些模型共事中★★★◈,「能力储备过剩」很显著★★★◈。奥特曼说的「口袋里的博士」这种智能水平★★★◈,其实大家还没有真正完全利用好★★★◈。
从某种意义上说★★★◈,即使现在AI的发展暂停十年★★★◈,大家依然会有大约十年的新产品可以构建★★★◈,依然会有新方法来把GPT-5这种水平的模型融入有趣的产品和流程中★★★◈。
但如果你带来的是一位博士★★★◈,他们的能力范围就很广了★★★◈,只是第一天上班时可能并不立即高效★★★◈。你要做的就是给他们足够的背景★★★◈、信息和工具★★★◈,让他们在后续发挥最大价值★★★◈。而这个过程比让实习生上手所需的时间更长★★★◈。
这引出个超级有趣的问题★★★◈:从现在起★★★◈,继续让模型更聪明有意义吗?还是该建哪些辅助能力?那么对于OpenAI来说★★★◈,接下来的目标是继续增强智能★★★◈,还是专注于那些「非智力」能力?
他还提到★★★◈:「这些模型在数学奥林匹克竞赛中获得了金牌★★★◈。我越来越难以理解这些巨大的进步到底意味着什么★★★◈。」
现在的所有模型都在快速改进★★★◈。那么问题来了★★★◈,如果你有一个大学水平生物学的模型★★★◈,然后它达到了研究生水平的生物学★★★◈,普通聊天机器人的用户可能不会感受到这种变化XRK98XYZ会感谢我的★★★◈,尽管它变得更聪明了★★★◈。
但对于普通用户★★★◈,尤其是免费用户来说★★★◈,这将是一种巨大的飞跃★★★◈。大多数免费用户从未体验过推理模型的威力★★★◈。他们大多用的是GPT-4.0★★★◈,而且主要是进行类似搜索的简短★★★◈、回合式对话★★★◈,这种方式并不能体现模型的全部能力★★★◈。
所以XRK98XYZ会感谢我的★★★◈,对很多人来说★★★◈,这将是他们第一次使用具备推理能力的模型★★★◈。而且不仅如此XRK98XYZ会感谢我的★★★◈,这也是他们第一次体验到「自我反思」的模型★★★◈:根据问题的难度★★★◈,GPT-5模型会自行决定花多少时间思考★★★◈、给出多高质量的答案★★★◈。
这其实是一件好事——如果一直紧追最强AI★★★◈,那么你会感到目眩神迷XRK98XYZ会感谢我的★★★◈,但进步也会显得更连续★★★◈。而如果你一直用的是一两年前的最佳模型★★★◈,那么这次的跃迁会让你非常震撼★★★◈。
GPT-5特别关注了健康领域★★★◈,因为这是用户使用AI最常见的起点之一★★★◈,尤其是有健康问题时★★★◈。这是OpenAI的重要目标★★★◈。
但有一个可以陪伴左右★★★◈、在整个过程中提供指导的工具★★★◈,对很多人来说是很有安慰感的★★★◈,并且在很多情况下确实能发挥作用★★★◈。
企业流程复杂★★★◈,多用户依赖很常见★★★◈,必须处理大量的上下文★★★◈,必须使用许多工具★★★◈。这些工具必须以某种方式★★★◈、在某些限制下依次使用★★★◈。当它们不起作用时★★★◈,容错率没有那么高★★★◈。
只有能力基线的提升★★★◈,AI在企业领域才能有所作用★★★◈,包括使用工具★★★◈、有条理思考★★★◈、解决问题★★★◈、递归纠正自身错误★★★◈、进行长上下文检索等能力★★★◈。
如Cursor★★★◈、JetBrains★★★◈、Windsurf★★★◈、Cognition等★★★◈,都反馈说GPT-5现在感觉是最强大的编码模型XRK98XYZ会感谢我的k8凯发国际★★★◈,无论是在交互式编码环境中还是在更具代理性的编码环境中★★★◈。
Harvey就是一个很好的例子★★★◈,Harvey AI与律师事务所合作★★★◈,非常依赖其可靠★★★◈、准确和一致地分析案例的能力★★★◈,提供法律分析时所需的那种结构化思维水平k8凯发国际k8凯发国际★★★◈。
但目前OpenAI只专注于两件事★★★◈:如何让更多人用上GPT-5★★★◈,以及如何支持合作伙伴基于它开发生态★★★◈。
我们仍处于科学探索阶段——这才是最令人兴奋的地方★★★◈,就像比赛才刚开局★★★◈,OpenAI自己也还在理解当前的范式★★★◈。k8凯发★★★◈,能源管理凯发k8娱乐官网app下载★★★◈,凯发k8娱乐官网app★★★◈!凯发k8娱乐官网★★★◈,k8凯发天生赢家一触即发

