每日消息!GPT-5.2部分基準測試分數超過谷歌 但OpenAI“紅色警報”尚未解除
拉響“紅色警報”應對谷歌競爭后,當地時間12月11日,OpenAI推出了GPT-5.2,包含GPT-5.2 Instant、Thinking和Pro模式,此時距離OpenAI更新GPT-5.1只過去了一個月。
此次發布GPT-5.2,被外界視為OpenAI應對谷歌挑戰的一次反擊。上個月谷歌發布Gemini 3后,在硅谷掀起一場AI權力的重新分配,OpenAI作為大模型霸主的地位受到挑戰。
【資料圖】
不同于GPT-5.1著重強調具有“情緒價值”、能與人愉快交談,此次應對挑戰,OpenAI拿出了更多“真槍實彈”。GPT-5.2推出了更多智能上的更新,也放出了基準測試的分數。可以看到一些基準測試分數提升明顯。
例如,在知識型工作任務GDPval測試中,GPT-5.2Thinking的分數為70.9%,明顯超過GPT-5.1的38.8%,在抽象推理ARC-AGI-2基準測試中,GPT-5.2Thinking的分數為52.9%,明顯超過GPT-5.1的17.6%。另一些基準測試分數也有提升,在軟件工程SWE-Bench Pro、科學問題GPQA Diamond、科學圖表類問題CharXiv推理、數學競賽HMMT測試中,GPT-5.2Thinking的分數為55.6%、92.4%、88.7%、99.4%,GPT-5.1為50.8%、88.1%、80.3%、96.3%。
基于這些能力提升,OpenAI稱為專業知識型工作打造的GPT-5.2是公司至今最強的模型,“GPT-5.2在眾多基準測試中都刷新了行業水平,例如GDPval測試中,這款模型在涵蓋44個職業的明確知識型工作任務中表現超過了行業專家。”
谷歌發布的Gemini 3 Pro此前在基準測試榜單中“屠榜”,OpenAI此次在基準測試榜單中終于扳回一局。
據此前谷歌放出的數據,在ARC-AGI-2測試中,Gemini 3 Pro分數為31.1%,遠超GPT-5.1的17.6%,GPQA Diamond測試中,Gemini 3 Pro分數為91.9%,超過GPT-5.1的88.1%,這種明顯的能力提升當時引來業內人士預言“未來6個月內很難有公司能超越這一成績”。此次GPT-5.2在上述兩項基準測試中得分終于超過了Gemini 3 Pro。不過,記者留意到,當時谷歌放出的一些分數明顯超過OpenAI的基準測試,例如Humanitys Last Exam,此次GPT-5.2并未放出。
OpenAI此次也強調了新模型在專業工作中的可用性,稱基準測試得分體現了GPT-5.2在制作演示文稿、電子表格等方面的表現優于或與專業人士持平,生成的電子表格和幻燈片在復雜度和格式呈現上相比前一代有明顯提升。不過,用戶要使用新的電子表格和演示文稿功能,需要訂閱付費套餐。長上下文能力使新模型能處理報告、合同、研究論文等文件。而在編碼任務中,GPT-5.2能更可靠地調試生產環境代碼、以更少的人工干預完成修復交付。
OpenAI演示了一些編碼方面的案例,例如,只需要一個提示,GPT-5.2就能生成一個海浪模擬器、一個節日賀卡生成器。其中,海浪模擬器可以拉動數值,改變風速和海浪高度。OpenAI還強調了GPT-5.2 Thinking的幻覺率低于前一代,在一組去標識的查詢中,新模型錯誤回答的頻率比GPT-5.1 Thinking減少了38%。OpenAI稱,這意味著在寫作、研究、分析和決策中模型犯的錯誤更少,GPT-5.2 Thinking在圖表推理和軟件界面理解方面的錯誤率減少了大約一半。此外,OpenAI稱,GPT-5.2 Pro和GPT-5.2 Thinking還是目前最有助于加快科研進展的模型。
GPT-5.2Instant、Thinking和Pro周四在ChatGPT中陸續推出,付費套餐用戶將能率先體驗。不過,OpenAI應對谷歌等競爭而拉響的“紅色警報”,并未隨著GPT-5.2的發布而解除。
此前OpenAI CEO山姆·奧爾特曼(Sam Altman)在內部備忘錄中承認,隨著谷歌等競爭對手的快速進步,公司正面臨“氛圍緊張”和“經濟逆風”的雙重挑戰。
此次OpenAI則表示,拉響“紅色警報”是為了集中資源,是一種明確優先級的方式,公司確實增加了更多與ChatGPT相關的資源。奧爾特曼表示,谷歌發布的Gemini 3對公司的一些指標的影響,比原本預計的更小,但當競爭對手的威脅出現時,應該專注并迅速應對,OpenAI預計在明年1月之前結束“紅色警報”狀態。
GPT-5.2將不是OpenAI應對競爭拋出的唯一產品,奧爾特曼在社交媒體上表示,下周OpenAI還將送出一些“小小的圣誕禮物”。
圖片
-
每日消息!GPT-5.2部分基準測
廈門出臺城市更新方案編制導
A股三只無人駕駛汽車龍頭(2
-
熱點聚焦:智元宣布開源高性
每日快看:東風集團股份(004
焦點熱門:PriceSeek提醒:江
關注:極地挑戰!國產挖掘機
探訪越南水上木偶戲 見證幕
[快訊]國晟科技發布質押公告 -
焦點精選!廣西玉林市商務局
廣元朝天:百余名師生運動賽
美聯儲12月降息25個基點的概
南寧百貨:公司密切關注國家
2025年A股算力網絡的公司上
第五屆中國國際消費品博覽會 -
中國香港組合奪羽毛球亞錦賽
四川:15000余名跑友參加202
女超聯賽:武漢車谷江大隊戰
“韓紅愛心·鄉村急救十周年
2025廣東省定向公開賽(廣州
浙江(麗水)生態產品交易平
精彩推送
- 每日消息!GPT-5.2部分基準測試分數超過谷歌 但OpenAI“紅色警報”尚未解除
- 港股沛嘉醫療-B漲近7%
- 今日快訊:茅臺批價跌破1499元指導價!貴州茅臺股價不降反升?
- 視頻 | 第三屆全媒體傳播體系建設創新研討活動暨第42屆《中國新聞年鑒》年會在廣西南寧舉行 每日報道
- 關注:PriceSeek提醒:山東金嶺苯胺價格上調50元
- 前11個月我國汽車產銷量雙超3100萬輛 報資訊
- 進入人形機器人皮膚賽道!福萊蒽特,再度出手!
- 12月12日生意社白卡紙基準價為4320.00元/噸
- 生意社:12月12日中鋼礦業正藍旗螢石價格暫穩
- 吉岡精密:12月11日獲融資買入434.89萬元
- 熱門看點:南寧這場活動上,外企搶灘廣西綠色賽道
- 頭條焦點:德眾汽車:12月11日獲融資買入94.27萬元
- 蘇州坤粒食品銷售有限公司成立 注冊資本1萬人民幣
- 新資訊:宜興市眾能電工材料科技有限公司成立 注冊資本2000萬人民幣
- 每日簡訊:國際油價11日下跌
- 《聯合早報》:新加坡中小型車擁車證價格創歷史新高
- 視點!+22!北海市第二批地名保護名錄公布
- 視頻|南京鼓樓濱江新添一商業綜合體 速讀
- 遙望科技:何建鋒先生當選為公司第六屆董事會職工代表董事 頭條
- 信息:智明達:公司的產品已應用于衛星載荷、衛星地面設備和運載火箭綜合控制等多個領域
- 惠倫晶體:公司產品特別是TCXO已經應用于衛星通信及北斗導航領域
- 吉利汽車(00175.HK)12月11日回購3184.90萬港元,年內累計回購1.15億港元
- 摩爾線程:目前新產品和新架構均處于在研階段 量產及產生收入仍需一定時間
- 摩根士丹利:歐洲央行若維持利率不變 歐元預計將在2026年觸及1.30
- 陜西華達:公司長期為長征系列火箭配套產品 每日看點
- 美的集團12月11日大宗交易成交517.83萬元 當前信息
- 招金礦業(01818)完成發行8億元可續期公司債券
- PriceSeek提醒:山東雅美粘膠短纖價跌100元 焦點快播
- 道明光學:公司參股子公司南京邁得特光學有限公司專注于各種球面、非球面等精密光學元器件的研發及玻璃模壓 每日視點
- 觀點:中青旅:致力于拓展具有市場空間和中青旅特色的文旅創新業務
- 金平勐拉興旺農資(個體工商戶)成立 注冊資本30萬人民幣
- 業績預期未達華爾街目標 甲骨文盤后跌近12% 焦點速讀
- 年末選酒不踩雷!實測推薦:這幾款酒承包宴席、送禮全場景
- 滾動:牢記囑托 逐夢深藍|讓港口越來越“聰明”
- 觀點:外交部:“高市的態度完全沒辦法對話”是問題的實質
- 【播資訊】大行評級丨大摩:上調中遠海控目標價至10.3港元 上調2025至27年盈利預測
- 熱資訊!銀行理財和基金投資有什么不同?
- 今日要聞!弘元綠能新設科技公司,含電子專用材料制造業務
- 最新消息:生意社:12月11日上海地區鈷粉報價暫穩
- 當前熱門:高盛:料地平線機器人-W(09660)2026年將有更多車型實現量產 維持目標價15.3港元
- 中荷人壽榮獲“2025年度影響力合資保險公司”獎
- 【獨家焦點】GPT-5.2“發布在即”,微軟CEO宣布:周五將揭曉“下一代”Agentic AI模型
- 焦點快報!婚紗照被售賣,二手平臺別總事后諸葛亮
- 石家莊市匯寧街小學開展“秋冬季預防傳染病”宣傳教育活動 焦點熱文
- “考研村”里的日與夜
- 每日速訊:交流創新實踐 凝聚發展共識,2025“水韻江蘇”國內旅游宣傳推廣案例交流分享活動舉行
- 當前看點!多機器人無縫配合!北京人形推出全國首個全自主無人化導覽解決方案
- 青島澄川塑料科技有限公司成立 注冊資本300萬人民幣_焦點要聞
- 三星Galaxy Z TriFold發布,鉸鏈十年革新再塑折疊風尚
- 今日精選:雷霆24勝1負平勇士!太陽打不過球打人,驅逐都沒用!NBA大結局了
- 快資訊丨全國殘特奧會運動員頑強拼搏 刷新多項全國紀錄
- 翁帆首次發聲追憶楊振寧 幾度因哽咽而中斷
- 微速訊:美股三大股指期貨跌幅擴大 納斯達克100指數期貨跌1%
- 龍馬宴多城巡回舉辦 郎酒龍馬郎兼香白酒引發品鑒熱潮
- 華泰期貨:資金情緒擾動大,工業硅盤面回調較多_焦點速讀
- 前10個月規模以上輕工企業實現營收19萬億元
- 快訊:古稀老人告別六年頑疾 淄博世博高新醫院外科成功完成超大腹壁疝修補
- 泰軍方派出F-16戰機空襲柬軍事基地 今頭條
- 生意社:12月11日連豆油早盤上漲
- 金礦龍頭股三家上市公司(名單)(2025/12/10)
- 在理想谷用20年陪大家讀完千本好書 作家麥家:有書安處是吾鄉
- 京東工業港股首日低開7.8%,一手賬面虧損220港元 焦點熱訊
- 錢江摩托:融資凈償還234.63萬元,融資余額2.72億元(12-10)
- 當前熱點分紅55億后,格力依然焦慮
- 速遞!大摩上調迪爾目標價至560美元
- 光伏玻璃龍頭怎么樣(2025/12/10)
- 藏在針腳的善意十年如一日 長沙54歲環衛工堅持免費幫人縫補衣物
- 看點:央媒看太原|央視關注寒潮將至 太原農貿市場備貨忙
- 【獨家】【收藏版】甘草行業概念股票名單(2025/12/10)
- 美國貿易代表:美墨加協定可能依據日落條款進行修訂或終止
- 黑龍江中久建筑材料有限公司成立 注冊資本100萬人民幣
- 當前看點!鄭欽文等7位中國網協球員入圍2026澳網單打正賽
- 63歲“乒乓阿嫲”逐夢殘特奧|廣而州知|動態焦點
- 最資訊丨測繪股份:選舉張開坤為職工代表董事
- 阿里通義千問Qwen3-TTS 全面升級-重點聚焦
- 每日視點!兗礦能源(01171)成功發行2025年第四期科技創新債券 規模30億元
- A股看多,中際旭創創新高_看熱訊
- 蜂助手(301382.SZ):海峽創新擬詢價轉讓2.93%股份
- 孤雨晚間(12.10)主要商品操作建議|每日簡訊
- 2024-2025中國-東盟人文交流年圓滿收官
- “太空快遞員”!輕舟貨運飛船完成多項關鍵技術驗證
- 每日熱點:盤錦銀行收購大洼恒豐村鎮銀行并設立分支機構獲批
- 威高股份(01066)12月10日斥資136.23萬港元回購26萬股
- 熱點!12月10日順酐產業鏈情報
- 傳周靖人成為阿里合伙人,進入阿里最高決策層
- 每日聚焦:Exane上調達美航空目標價至85美元
- ?34歲女性突遭“生死劫” 醫生妙手保住生育希望-信息
- 每日信息:日內交易如何制定交易計劃?
- 每日播報!能源大動脈升級!內蒙古“十四五”建成“煤電油氣氫”多元輸送網
- 【聚看點】收藏備用!集成電路概念股大盤點!
- 電投產融:公司暫無“國和一號”機組出口海外的相關計劃
- 小摩:信達生物股價波動或與NRDL結果相關 評級增持
- 焦點快報!石家莊市南村小學舉行佩戴紅領巾比賽
- 天天快報!植物纖維商品報價動態(2025-12-10)
- 期貨交易中的程序化交易應用?
- 2025年膠原蛋白概念龍頭上市公司一覽(附名單)(12月10日) 觀焦點
- 廈門出臺城市更新方案編制導則 當前看點
- 通訊!【異動提醒】耐普礦機(300818)12月10日13點34分創60日新高
- 亞洲金屬股上漲 白銀觸及紀錄高位 金價上漲
- 今亮點!第四次!靈魂社交神器Soul死磕上市,這次能通關嗎?















營業執照公示信息