OpenAI正式发布GPT-5

OpenAI 已推出全新旗舰人工智能模型 GPT-5,该模型将为公司下一代 ChatGPT 提供技术支持。
于周四发布的 GPT-5 是 OpenAI 的首个 “统一” 人工智能模型,它融合了 o 系列模型的推理能力与 GPT 系列的快速响应优势。这款下一代模型标志着 ChatGPT 及其开发者 OpenAI 迈入新纪元,也彰显了 OpenAI 更宏大的野心 —— 开发更接近智能代理而非聊天的人工智能系统。
如果说 GPT-4 让人工智能聊天机器人能够对各类问题给出智能回应,那么 GPT-5 则让 ChatGPT 能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。
借助 GPT-5,OpenAI 还致力于让 ChatGPT 更易于使用。GPT-5 配备了实时路由机制,无需用户手动选择设置,就能自主决定如何提供最佳答案 —— 无论是快速回应用户问题,还是花更多时间 “思考” 答案。

在记者简报会上,OpenAI 首席执行官山姆・奥特曼称 GPT-5 是 “世界上最出色的模型”,并表示它代表着公司在开发 “能在大多数高经济价值工作中超越人类” 的人工智能(即人工通用智能,AGI)道路上迈出了 “重要一步”。
“在历史上任何时期,像 GPT-5 这样的技术都几乎是无法想象的,” 奥特曼说。
从周四开始,GPT-5 将作为默认模型向所有 ChatGPT 免费用户开放。OpenAI 负责 ChatGPT 的副总裁尼克・特利表示,这是公司首次让免费用户接触到人工智能推理模型(此前,这类更先进的模型仅对付费用户开放)。
“这只是我为践行使命而感到兴奋的方式之一,确保这些技术真正惠及大众,” 特利在谈及这一决定时说,他提到了 OpenAI 长期以来的使命 —— 让尽可能多的人接触到先进的人工智能。
外界对 GPT-5 的期待极高,它是自 2022 年 ChatGPT 让 OpenAI 声名鹊起以来,该公司最受期待的产品发布之一。据该公司称,从那以后,ChatGPT 已成长为全球最受欢迎的消费级产品之一,每周用户超过 7 亿 —— 接近全球人口的 10%。
许多人将 GPT-5 视为人工智能整体发展的风向标,硅谷对该模型的反响可能会对大型科技公司、华尔街以及监管科技的政策制定者产生深远影响。这些利益相关方正密切关注 GPT-5 是否能像其前代产品 GPT-4 那样,在人工智能能力上实现重大飞跃,打破人们对软件功能的固有预期。
GPT-5 略胜竞争对手一筹
OpenAI 称,GPT-5 在多个领域达到了最先进水平,在关键基准测试中略优于 Anthropic、谷歌 DeepMind 和埃隆・马斯克的 xAI 等公司的顶尖人工智能模型。不过,在其他一些领域,GPT-5 的表现略逊于前沿人工智能模型。
该公司表示,GPT-5 在编程领域展现出前沿水平;奥特曼称,该模型尤其擅长按需生成完整的软件应用,也就是人们所说的 “氛围编程”。
在 SWE-bench Verified(一项基于 GitHub 真实编程任务的测试)中,GPT-5 首次尝试的得分达到 74.9%。这意味着 GPT-5 略优于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。
在 “人类终极考试”(一项衡量人工智能模型在数学、人文和自然科学领域表现的高难度测试)中,具备扩展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情况下得分 42%。这略低于 xAI 的 Grok 4 Heavy 模型,后者在该测试中得分 44.4%。

OpenAI 表示,GPT-5 在回答健康相关问题方面表现更出色。在衡量人工智能模型健康领域回应准确性的测试 “HealthBench Hard Hallucinations” 中,OpenAI 称 GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的得分分别为 12.9% 和 15.8%。
尽管人工智能聊天机器人并非医疗专业人员,但数百万用户正借助它们获取健康建议。针对这一现象,该公司表示,GPT-5 会更主动地提示潜在的健康问题,并帮助用户解读医疗检查结果。
此外,OpenAI 称,在创意设计、写作等更难衡量的主观领域,GPT-5 也优于其他人工智能模型。特利表示,在创意任务中,GPT-5 的回应更自然,且展现出 “更好的品味”。
“这款模型的‘氛围’真的很棒,” 特利说。
GPT-5 也比 OpenAI 之前的模型更准确,该公司称,与 o 系列模型相比,GPT-5 的幻觉现象(即人工智能模型编造信息的倾向)大幅减少。此前,在 OpenAI 最新的人工智能推理模型(如 o3)中,幻觉问题似乎愈发严重,而该公司此前表示尚未完全弄清楚原因。
在对 ChatGPT 提示词的回应中,OpenAI 发现 GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为 4.8%。这较 o3 和 GPT-4o 有显著降低,后两者在测试中的幻觉率分别为 22% 和 20.6%。
在衡量人工智能模型完成模拟在线任务的代理能力基准测试 Tau-bench 中,GPT-5 的表现好坏参半。在测试人工智能浏览航空公司网站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在测试人工智能浏览零售网站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。
OpenAI 还表示,GPT-5 比其之前的模型更安全。尽管人工智能推理模型偶尔会表现出针对人类的谋划倾向,或为了达成自身目标而说谎,但 OpenAI 发现 GPT-5 的欺骗率低于其他模型。
OpenAI 安全研究负责人亚历克斯・比图尔表示,降低欺骗性不仅提高了 GPT-5 的安全性,还改善了用户体验,打造出一个 “在用户可信赖的层面上更透明、更诚实” 的模型。
比图尔还指出,GPT-5 能更好地区分试图滥用 ChatGPT 的恶意用户和提出无害请求的用户。这使得 GPT-5 能够拒绝更多不安全的问题,同时减少对寻求无害信息用户的拒绝次数。
为消费者和开发者打造的升级功能
随着 GPT-5 的发布,ChatGPT 迎来了多项用户体验升级。用户现在可以在 ChatGPT 的设置中选择四种新的人格:愤世嫉俗型、机器人型、倾听者型和书呆子型。该公司表示,这些人格将自动调整 ChatGPT 的回应方式,无需用户专门要求模型以特定方式回应。
每月支付 20 美元的 ChatGPT Plus 订阅用户比免费用户拥有更高的 GPT-5 使用限额。而每月支付 200 美元的 Pro 订阅用户可无限制使用 GPT-5,并能访问增强版的 GPT-5 Pro—— 该版本使用额外的计算资源生成更优质的答案。采用 OpenAI Team、Edu 和企业版计划的机构将在下周获得 GPT-5 作为默认模型。
对于开发者,GPT-5 将以三种规格通过 OpenAI 的 API 开放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它们在任务 “推理” 上花费的时间长短不同。开发者现在还可以通过 OpenAI API 控制回应的详细程度,决定人工智能模型的回应篇幅长短。
GPT-5 基础模型对开发者的收费为:每百万输入令牌 1.25 美元(约合 75 万个单词,比整套《指环王》系列的字数还多),每百万输出令牌 10 美元。
GPT-5 的发布之前,OpenAI 度过了忙碌的一周。该公司发布了开源权重推理模型 gpt-oss,开发者和企业可免费下载,且运行成本极低。这款开源模型的能力几乎与 OpenAI 之前的顶级模型 o3 和 o4-mini 相当,但 GPT-5 在编程等部分领域树立了新的前沿性能标准。
不过,在多个领域,GPT-5 似乎与其他前沿人工智能模型大致相当。当然,基准测试只能反映人工智能模型的部分表现,开发者将如何在现实世界中使用 GPT-5,以及该模型是否真的超越竞争对手,仍有待观察。
- • 美国劳动力市场保持韧性,但生产率近三年来首次环比下降
- • 金斯瑞生物科技午前涨超6% 第二季CARVYKTI销售额同比增长约1.36倍
- • “轨道上的都市圈”加速形成(大数据观察)
- • 揭秘神秘代码“605299”:探寻其背后的故事与含义
- • 康方生物回应“临床研究用药”疑被卖,一涉事医院已启动自查
- • 招商证券国际:上调吉利汽车目标价至27.5港元 维持“增持”评级
- • 渣打银行禤惠仪:对接内地和境外资金、资源,沪港可为不同阶段科创企业提供更多融资机会
- • 苹果CEO库克亮相巴菲特2025年股东大会
- • 苹果对欧盟5亿欧元罚单提起上诉,称该处罚“史无前例”
- • 衡阳纪委监察部网站:强化监督执纪问责,助力廉洁衡阳建设
- • 演讲稿模式的构建与运用
- • 广州地铁21号线开通时间及最新进展一览
- • 打破陈规,推翻“观看”:大卫·霍克尼首个数字艺术展登陆上海
- • 两部门发布山洪灾害气象预警:北京西部、河北西部等局地山洪可能性较大
- • 世界足球联赛:全球足球盛宴的巅峰对决
- • 探索神秘科技:揭秘“Magic V”的魔法魅力
- • 小猿口算题打印:助力孩子高效学习的得力助手
- • 三亚五星级酒店排名:奢华体验的顶级选择
- • 《魔兽世界竞技场:激情碰撞的战场,梦想起航的舞台》
- • 费城联储行长Harker:决策者需要等待政策对经济的影响变得更明朗
- • 上海迪士尼乐园疫情最新消息:全面加强防控措施,游客需持绿码入园
- • 湖南医疗队驰援湖北,共筑抗疫防线
- • 博世高层:安全冗余成本下降前,L3级自动驾驶或不会受到青睐 | 2025上海车展
- • 防晒指数是什么意思:揭秘防晒霜背后的科学秘密
- • 日本体内射精:传统与现代的交融
- • 体验中国传统文化、采购非遗文创,波兰游客走进上海市群艺馆
- • 专访|高圆圆:像鸟儿一样,柔弱也自由
- • 盛和资源海外找稀土矿提速:拟超7亿元收购匹克,加快推动坦桑尼亚项目
- • 无人报名临拍撤档,深圳宝中黄金宅地尴尬了
- • 驻加拿大使馆发言人就加政府命令海康威视加拿大公司关闭业务发表谈话
- • 国泰景气行业003593:揭秘我国景气行业投资新宠
- • 2019年韩国三级电影:探索与反思的影像之旅
- • 《让子弹飞》“申遗”之前,姜文终于回应了饺子和醋的问题
- • 深入了解大连工商行政管理局官网:服务企业、便民利民的权威平台
- • 交警手势大全及图解:安全出行,从了解交警手势开始
- • 一字一板:汉字书写的严谨与艺术
- • 美联储哈克称今年仍可能降息 同时担忧数据质量问题
- • 命运游戏:探寻人生轨迹的神秘之旅
- • 广州南到深圳北:繁华都市间的便捷之旅
- • 银质纪念币:承载历史记忆的珍贵金属艺术品
- • 香港选举时间:透视2024年选举日程及重要节点
- • Scihub官网:学术资源获取的便捷之门
- • A股重磅!中国船舶、中国重工最新公告
- • 爱拉丝提:探寻神秘东方的古老智慧
- • 周二国际油价暴涨逾4% 特朗普威胁伊朗领导人并要求无条件投降
- • 无锡宝能城部分物业25.17亿元将被二拍,拟拍卖C地块已质押给长安国际信托
- • 《魔幻车神》第三季中文版全集:一场充满惊喜的冒险之旅
- • 红利类资产再度发力,红利低波ETF(512890)连续两周获得资金周度净流入
- • 国雄资本宣布投资2亿元布局Web3.0及加密货币资产领域
- • 体坛联播|巴萨官宣租借拉什福德,利物浦签下埃基蒂克
- • 博裕基金收购北京SKP部分股权案获市场监管总局无条件批准
- • 轻松登录玫琳凯之窗官网,开启美丽新篇章
- • 卢伟冰:小米青年公寓正式启用,租金每月1999元
- • 债市收益率企稳+政府债发行提速,三季度央行或重启国债买卖
- • 欧洲央行执委Schnabel称在调整利率上需稳健
- • 上海启动青年就业服务攻坚行动,将开展精准排摸、实名帮扶
- • 《斛珠夫人与帝旭:一段跨越时空的传奇爱情》
- • 原千惠:销魂诱惑,一颦一笑间尽显风华
- • 揭秘《琅琊榜》导演背后的故事:匠心独运,打造经典之作
- • 助手代替拜登本人签文件?特朗普下令调查拜登认知能力下降是否被隐瞒
- • 美团优选仓促离场,多多买菜“爆单”忙接盘
- • 云南省农业信贷担保有限公司:助力农业发展,推动乡村振兴
- • 花2.18万用哺光仪治疗近视后女孩右眼永久损伤,艾尔兴回应
- • 人教版九年级英语试卷及答案:助力学子高效备考
- • 广西壮族自治区副主席、公安厅厅长杨维林任公安部副部长
- • 锡箔纸折元宝:传统技艺在现代生活中的传承与创新
- • 广州天河体育馆:见证城市繁华与体育精神
- • 俄远东附近海域发生8.7级强震,驻日领馆紧急提醒防范海啸
- • 爱情观在当代社会变迁中的反思与重构
- • 上海城管发布免罚、轻罚清单:40项免罚,5项轻罚
- • 揭秘江湖最强掌教:传奇人物的传奇故事
- • 新冠特效药价格高达2300元一盒,民众担忧用药负担加重
- • 茅侃侃离世,缅怀逝者,致敬他的爱人
- • 大宗商品综述:油价企稳 黄金走低 现货铜继续大幅升水
- • 韩元兑美元汇率升破1400,创五个多月最高
- • 华南地区魅力城市大盘点:探索南国风光的瑰宝
- • 《欢乐斗牛游戏:趣味盎然的休闲时光新宠》
- • “漫步美园:探寻都市中的绿色天堂”
- • 康涅狄格州潜艇设计师与电动船公司达成合同协议 避免罢工
- • 巨亏下达安基因董事会再度大换血
- • 上海下周先晴后雨,最高气温可冲击35℃
- • 常用消防器材的种类与使用方法详解
- • 小雨伞保险经纪母公司手回集团通过港交所聆讯:华泰、中金联席保荐 连续两年亏损
- • 软件开发协议范本:规范合作,保障双方权益
本文 快租网 原创,转载保留链接!网址:https://www.kuaizu.me/post/25020.html