一文读懂GPT 5.4：83%任务执行超人类专家，打个招呼80美元就烧完了 [复制链接]

coffee198375

军衔等级：

大元帅

2480

电梯直达

1^# 大中小

发表于 2026-3-6 09:56:36 |只看该作者 |倒序浏览

北京时间3月6日凌晨，OpenAI正式发布新一代旗舰模型GPT-5.4，官方定位为"专为专业工作而设计的最强且最高效的前沿模型"。

比起“更强更快”的常规叙事，这次发布真正值得关注的是模型角色的转变：GPT-5.4是一个为Agent而生的模型。它首次将原生计算机操控能力融入通用模型，并同时整合了GPT-5.3-Codex级别的编程能力、百万Token上下文窗口和工具搜索机制——据官方介绍，没有为整合而牺牲任何单项能力。过去让AI操作电脑需要依赖专用的Computer Use Agent，现在编程、操控电脑、调用工具由同一个模型一并完成。

跑分印证了这一点：GDPval基准测试中，GPT-5.4在83%的任务上达到或超过行业专业人士水平；OSWorld桌面操控测试成功率75%，首次超过人类基线（72.4%）；编程能力与GPT-5.3-Codex持平，世界知识比GPT-5.2更强。

价格方面，GPT-5.4的API定价为输入$2.50/百万Token、输出$15，约为Claude Opus 4.6（$5/$25）的一半，且支持订阅额度调用。不过Pro版依然很贵——有网友仅发了一句"Hi"，GPT-5.4 Pro就认真推理了一番，直接烧掉80美元。日常轻量任务，标准版可能是更明智的选择。

在ChatGPT中，GPT-5.4以“GPT-5.4 Thinking”形式上线，逐步取代GPT-5.2 Thinking（后者将保留3个月，于2026年6月5日正式退役）。新增的前置思路概述功能让用户可以在模型执行过程中随时介入调整方向，网页版和Android已上线，iOS即将跟进。

如果用一句话概括GPT-5.4的意义，过去几年大模型的进化逻辑是"哪块短板补哪块"，GPT-5.4不再单点拔高，而是把所有能力整合进同一个模型做系统性优化。一个能写代码的模型是工具，一个能写代码、打开浏览器查文档、调用API验证结果、再把输出整理成报告的模型，是工作系统。GPT-5.4更接近后者。

本主题由版主或管理员于 2026-3-6 10:20 移动

0 举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2026-3-6 12:44 , Processed in 0.100355 second(s), 16 queries , Gzip On.

Discuz Licensed

回顶部

		自动登录	找回密码
密码			注册