科技圈翹首以盼的GPT-5發(fā)布會(huì)上,戲劇性一幕突如其來(lái)。原本聚焦于模型卓越性能展示的時(shí)刻,卻因一組錯(cuò)誤頻出的基準(zhǔn)圖,令全場(chǎng)嘩然。圖表中數(shù)據(jù)與實(shí)際標(biāo)注南轅北轍,不僅讓演示效果大打折扣,也引發(fā)網(wǎng)友們?nèi)撼?。事后,奧爾特曼坦率承認(rèn)圖表失誤,直言這是嚴(yán)重且不該出現(xiàn)的問(wèn)題。可這場(chǎng)風(fēng)波,已然在GPT-5閃耀登場(chǎng)之際,蒙上了一層陰影。
GPT-5發(fā)布 基準(zhǔn)圖錯(cuò)誤遭吐槽 面向所有用戶開(kāi)放!當(dāng)?shù)?a href="http://m.tjggzx.org.cn/zq/shijian/" target="_blank">時(shí)間8月7日,OpenAI宣布推出新一代旗艦人工智能模型GPT-5,并稱其為“世界上最好的模型”,將免費(fèi)提供給用戶。該模型面向所有用戶開(kāi)放,包括免費(fèi)用戶、Plus用戶、Pro用戶和團(tuán)隊(duì)用戶。下周還將向企業(yè)用戶和教育用戶推出。
OpenAI表示,GPT-5的智能性能遠(yuǎn)超公司之前的所有模型,在編碼、數(shù)學(xué)、寫(xiě)作、健康、視覺(jué)感知等領(lǐng)域均表現(xiàn)出色。新模型在響應(yīng)速度、回答準(zhǔn)確性以及減少“幻覺(jué)”方面都有顯著提升。ChatGPT團(tuán)隊(duì)負(fù)責(zé)人Nick Turley指出,與前代產(chǎn)品相比,GPT-5讓用戶感覺(jué)更自然。
OpenAI首席執(zhí)行官Sam Altman對(duì)GPT-5給予了極高評(píng)價(jià),認(rèn)為這是該公司朝通用人工智能目標(biāo)邁出的重要一步。他表示,無(wú)論是顯而易見(jiàn)的還是微妙的,GPT-5都給人更好的體驗(yàn),感覺(jué)像是在與任何領(lǐng)域的專家交談——一位博士級(jí)別的專家。
GPT-5在編程能力方面尤為突出,能夠僅憑一個(gè)提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站、應(yīng)用程序和游戲。在SWE-bench Verified基準(zhǔn)測(cè)試中,GPT-5首次嘗試的準(zhǔn)確率達(dá)74.9%,高于其他競(jìng)爭(zhēng)模型。此外,GPT-5在創(chuàng)意寫(xiě)作和健康咨詢方面也有所提升,能夠處理復(fù)雜的寫(xiě)作任務(wù),并更積極地標(biāo)記潛在健康問(wèn)題。
OpenAI還引入了一種新的安全訓(xùn)練形式,稱為“安全補(bǔ)全”。這種訓(xùn)練方法教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。GPT-5經(jīng)過(guò)訓(xùn)練后能夠識(shí)別任務(wù)何時(shí)無(wú)法完成,避免猜測(cè),并能更清晰地解釋局限性,從而減少了無(wú)根據(jù)的斷言。
此外,OpenAI還為ChatGPT用戶推出了四種預(yù)設(shè)性格:憤世嫉俗者、機(jī)器人、傾聽(tīng)者和書(shū)呆子。這些性格選項(xiàng)適用于文本聊天,未來(lái)還將擴(kuò)展到語(yǔ)音聊天,使用戶無(wú)需編寫(xiě)自定義提示詞即可設(shè)置ChatGPT的交互方式。
然而,在GPT-5的發(fā)布會(huì)上出現(xiàn)了一些小錯(cuò)誤,如現(xiàn)場(chǎng)展示的性能圖表存在數(shù)據(jù)與圖表顯示不匹配的情況。特斯拉CEO馬斯克也在社交媒體上指出了GPT-5在某些基準(zhǔn)測(cè)試中的表現(xiàn)不如預(yù)期。
微軟計(jì)劃將OpenAI的GPT-5整合到其Copilot生態(tài)系統(tǒng)中,包括Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundry和Copilot Studio。新的智能模式支持動(dòng)態(tài)模型切換,以增強(qiáng)推理和特定任務(wù)的響應(yīng)。開(kāi)發(fā)人員可以通過(guò)Azure AI Foundry利用GPT-5,確保AI驅(qū)動(dòng)的應(yīng)用程序中特定于任務(wù)的精度。
上一個(gè): 《戰(zhàn)地6》搶先體驗(yàn)將開(kāi)啟 公開(kāi)測(cè)試人數(shù)接近30萬(wàn)!
下一個(gè): 蘋(píng)果iOS26新增提醒回電功能 不再忘記回電話
瀏覽量:02025-09-21
瀏覽量:02025-09-21
瀏覽量:02025-09-20
瀏覽量:02025-09-20
瀏覽量:02025-09-19
瀏覽量:02025-09-19