亚洲国产成人91精品_99视频热这里只有精品免费_精品国产乱码久久久久久虫虫漫画_日韩精品三区

首頁 > 每日活動 > 每日活動 > “最強模型”GPT-5發(fā)布后評價褒貶不一,奧特曼回應

“最強模型”GPT-5發(fā)布后評價褒貶不一,奧特曼回應

發(fā)布時間:2025-08-11 19:49:05

北京時間8月9日,據(jù)彭博社報道,幾個月來,OpenAI CEO薩姆·奧特曼(Sam Altman)一直在大力宣傳GPT-5的性能,把它的發(fā)布描繪成了公司歷史上的關鍵時刻。但是在GPT-5發(fā)布后的24小時內,這款新模型收到了褒貶不一的評價

在周四的發(fā)布會上,OpenAI聲稱GPT-5在編程和處理復雜問題的推理能力方面更勝一籌,并表示它已先進到足以讓聊天機器人ChatGPT達到“博士級專家”的水平。

令人失望

雖然一些早期使用者稱贊了該模型,但也保留了意見。開發(fā)者西蒙·威利森(Simon Willison)在博客文章中寫道,“它是我目前最喜歡的新模型”,稱其“性能出眾”,“偶爾令人驚艷”,“但與之前的版本相比并沒有重大飛躍”。

在各大社交媒體平臺上,ChatGPT用戶對GPT-5持續(xù)存在編造信息、搞錯基礎數(shù)學和拼寫問題的情況表示失望。本特利大學數(shù)學系副教授諾亞·詹西拉庫薩(Noah Giansiracusa)認為,這次升級“令人失望”。他指出,雖然GPT-5“確實有些改進”,但“改進幅度比我期望的要小得多”。

奧特曼

奧特曼

部分用戶的負面反應,或許源于他們對技術底層運作機制的誤解。與OpenAI此前發(fā)布的模型不同,GPT-5會根據(jù)查詢內容自動切換不同復雜程度的模型。這種設計雖然能優(yōu)化公司的計算資源配置,但也意味著用戶并不總能調用到最強大的技術版本。

例如,在一次測試中,當被問及單詞“blueberry”中字母“b”出現(xiàn)了多少次時,GPT-5最初給出了“三次”的錯誤答案。但當被提示“仔細想一想”后,GPT-5似乎切換到了更高級的推理模型,給出了正確答案。

奧特曼:系統(tǒng)出故障

周五,奧特曼對部分用戶反饋作出恢復,承認系統(tǒng)存在技術故障。“從今天開始,GPT-5會顯得更聰明些,”他表示,“昨天自動切換器出現(xiàn)故障,大半天都無法正常工作,導致GPT-5表現(xiàn)得異常遲鈍。”

此次升級對OpenAI至關重要。OpenAI正在努力保持領先地位,應對來自美國和中國競爭對手日益激烈的競爭。同時,它還要說服企業(yè)用戶和個人用戶為其付費服務買單,以抵消其在人才、芯片和數(shù)據(jù)中心等方面的巨額投入,維持AI研發(fā)。

隨著AI系統(tǒng)的不斷進步,想要明確評判各類服務的優(yōu)劣變得越來越困難。截至周五中午,GPT-5已在LMArena(基于用戶評分的熱門AI模型排行榜)上登頂多個類別的榜首。但另一個基準測試ARC-AGI-2則顯示,GPT-5落后于埃隆·馬斯克(Elon Musk)旗下xAI的最新版Grok。

一些用戶認為GPT-5寫作更差

一些用戶認為GPT-5寫作更差

在缺乏更明確評估標準的情況下,模型之爭有時更多靠感覺來判斷。如今每周有近7億人使用ChatGPT,難免會有人對模型的表現(xiàn)感受不一。要評估一個新AI系統(tǒng)對個人生活與工作的價值,短短一天時間遠遠不夠。

賓夕法尼亞大學沃頓商學院教授伊桑·莫利克(Ethan Mollick)經(jīng)常試用各類AI模型,他對GPT-5的研究能力、機智的文字應答以及編程簡化功能(即便是對新手)贊嘆不已。

“GPT-5會自主完成各種任務,常常是超凡的任務,有時是奇怪的任務,有時則是非常AI式的任務,”他在博客中寫道,“而這正是它最迷人的地方。”

然而,在社交論壇Reddit上,用戶的反應卻截然不同。在周五的“有問必答”活動中,奧特曼面對了一些用戶的質疑。這些用戶對自己無法掌控和了解具體由哪個模型響應查詢感到不滿。奧特曼表示,OpenAI將采取措施解決這些抱怨,包括提高系統(tǒng)的“透明度”。

在活動中,奧特曼曾回應一位Reddit用戶的問題。他指出,OpenAI認為GPT-5的某個版本在“寫作質量”上優(yōu)于GPT-4.5。隨后他問道:“你覺得它更差嗎?”接著,用戶們立刻接二連三地回答說:“是的。”

每日活動更多>>

首屆鉑智 3X 用戶大會:廣豐首擔自燃泊車事故責,權益惠及新老用戶 8月新勢力眾生相 零跑領跑“蔚小米”邁過3萬輛門檻兒 奇瑞全新SUV,捷途X70L將上市,車長4810mm,5/7座都有,兩種動力 柴油動力逆襲!212 T01如何用1000km續(xù)航重新定義硬派越野經(jīng)濟性? 實力硬剛百萬級豪華MPV!2026款嵐圖夢想家預售價38.99萬元起 6.58 萬起,半固態(tài)電池批量上車!全新 MG4 成都車展“殺瘋了” 無法復工復產!眾泰汽車公告 8月銷量成績出爐:比亞迪霸榜,理想掉隊 理想銷量三連跌,8月銷量不及零跑一半,大勢去、頹勢顯! 普拉多跌落神壇?豐田高管硬剛外界質疑 上汽大通:國內泛房車市場年銷近2萬輛 堅持用乘用車標準造品質房車 全新奇瑞QQ亮相成都車展,能再一次引領市場嗎? 沒加電池,還得燒油!新212 T01開一年卻更省錢了? 21.99萬起,啟源E07煥新卷到誰? 9.78萬起,四個角度解讀榮威M7 DMH值不值? 全階量產,突破千萬大關!地平線征程芯片不想低調了 紅旗成都車展“攻守道”:金葵花守豪華之正,天工系列攻年輕之奇 星途ET5成都全球首秀:年輕家庭智慧安全SUV新選擇 全新坦克500上市2小時大定破1.2萬臺,牽手張雨綺刷爆成都車展 2025成都車展新車:38.99萬起,2026款嵐圖夢想家公布預售價 售訂單破4.8萬臺,智己LS6這張“超級增程”牌打對了 短軸大V6,長城炮V6火炮22.98萬起開啟預售 拓豪華越野新邊界,縱橫G700成都車展全球啟動盲訂 搭載三種動力,配備側滑門,五菱星光730MPV亮相成都車展 方程豹整活了!鈦 3 官方 “換臉” 上線,無損還合規(guī) 英國被曝向蘋果索取全球iCloud數(shù)據(jù)訪問權,涉及信息郵件密碼等 美國各地推廣互聯(lián)網(wǎng)用戶年齡檢查 批評人士警告稱可能危及隱私和言論自由 800美元以下包裹多年免稅政策終結 周五起需繳納關稅 賽力斯:2025年上半年凈利潤大漲81% 問界汽車交付超14.7萬輛 林肯的黃昏:當美式豪華淪為“雜物堆”旁的招租廣告
主站蜘蛛池模板: 肥城市| 台中市| 太湖县| 得荣县| 远安县| 固始县| 湘潭市| 施甸县| 泌阳县| 措勤县| 汕尾市| 齐齐哈尔市| 巴林右旗| 巴马| 商水县| 芒康县| 五大连池市| 育儿| 桐乡市| 奉贤区| 海口市| 托克托县| 长岛县| 英吉沙县| 夹江县| 晴隆县| 西宁市| 阿勒泰市| 靖远县| 长治市| 贵南县| 平昌县| 玉环县| 扎赉特旗| 凤山市| 茌平县| 壶关县| 浦北县| 昆山市| 博爱县| 渭源县|