當(dāng)?shù)貢r(shí)間周四(9月25日) ,人工智能(AI)研究公司OpenAI發(fā)布了一項(xiàng)新的基準(zhǔn)測試,用于比較其AI模型與各行業(yè)專業(yè)人士的工作表現(xiàn)。
這項(xiàng)測試名為GDPval,是一次初步嘗試 ,旨在評(píng)估OpenAI的系統(tǒng)距離在經(jīng)濟(jì)價(jià)值工作上超越人類有多近 。而經(jīng)濟(jì)價(jià)值工作是OpenAI開發(fā)通用人工智能(AGI)的關(guān)鍵環(huán)節(jié)。
OpenAI周四表示,其GPT-5模型以及競爭對(duì)手Anthropic公司的Claude Opus 4.1“已經(jīng)接近行業(yè)專家的工作質(zhì)量”。
這并不意味著OpenAI的模型會(huì)立刻取代人類工作 。盡管一些CEO預(yù)測AI在幾年內(nèi)就會(huì)取代人類,但OpenAI承認(rèn)GDPval目前只涵蓋人們實(shí)際工作中有限的一部分任務(wù)。不過 ,這是該公司用來衡量AI向這一里程碑邁進(jìn)的最新方式之一。
GDPval基于美國GDP貢獻(xiàn)最大的九個(gè)行業(yè),包括醫(yī)療、金融 、制造業(yè)和政府等領(lǐng)域 。測試覆蓋了44種職業(yè),從軟件工程師到護(hù)士再到記者。
在首個(gè)版本GDPval-v0中,OpenAI邀請(qǐng)資深專業(yè)人士對(duì)比AI生成的報(bào)告與其他專業(yè)人士的成果 ,并挑選出更優(yōu)者。
例如,某項(xiàng)任務(wù)要求投行人員為“最后一公里配送行業(yè) ”制作競爭格局分析,并與AI生成的報(bào)告進(jìn)行對(duì)比。OpenAI隨后將AI模型在全部44個(gè)職業(yè)中對(duì)抗人類報(bào)告的“勝率”進(jìn)行平均計(jì)算 。
結(jié)果顯示 ,GPT-5-high(高算力版本GPT-5)在40.6%的情況下被評(píng)為優(yōu)于或與行業(yè)專家持平。
而Anthropic的Claude Opus 4.1模型則在49%的任務(wù)中被評(píng)為不輸于行業(yè)專家,這一表現(xiàn)超過了OpenAI的模型。
OpenAI對(duì)此解釋稱,之所以Claude得分更高 ,部分原因是其傾向于生成更美觀的圖表,而非純粹性能更優(yōu) 。
需要說明的是,大多數(shù)職業(yè)的工作遠(yuǎn)不止提交研究報(bào)告 ,而這卻是GDPval-v0所測試的全部內(nèi)容。OpenAI承認(rèn)這一點(diǎn),并計(jì)劃在未來開發(fā)更全面的測試,涵蓋更多行業(yè)和交互式工作流程。
盡管如此 ,OpenAI仍認(rèn)為GDPval的進(jìn)展具有重要意義 。
OpenAI首席經(jīng)濟(jì)學(xué)家Aaron Chatterji在接受采訪時(shí)表示,GDPval的測試結(jié)果表明,這些崗位上的人們可以利用AI模型節(jié)省時(shí)間,從而專注于更有意義的工作。
“因?yàn)槟P驮谀承┦虑樯弦呀?jīng)變得很擅長 ,隨著能力的提升,人們可以越來越多地把部分工作交給模型,去做潛在更有價(jià)值的事情 ,”Chatterji說。
OpenAI評(píng)估負(fù)責(zé)人Tejal Patwardhan表示,她對(duì)GDPval的進(jìn)步速度感到鼓舞 。
Patwardhan指出,約15個(gè)月前發(fā)布的GPT-4o模型得分僅為13.7%(勝出或持平人類) ,而GPT-5的成績幾乎提高了三倍。她預(yù)計(jì)這一趨勢(shì)還會(huì)繼續(xù)。
配資專業(yè)股票配資網(wǎng)站:那個(gè)股票平臺(tái)好-OpenAI的GPT-5會(huì)否開啟人工智能界的價(jià)格大戰(zhàn)?
企業(yè)股票開戶流程:最新配資平臺(tái)排名-液冷新風(fēng)向?英偉達(dá)要求供應(yīng)商開發(fā)MLCP技術(shù) 成本較目前方案高3-5倍
股票配資平臺(tái)導(dǎo)航:全國前三配資平臺(tái)-OpenAI大動(dòng)作 融資客大手筆加倉這些業(yè)績有望持續(xù)高增長股
中國股票排名前十名:股票在哪個(gè)平臺(tái)開戶比較好-華為海思大動(dòng)作!績優(yōu)潛力概念股出爐 融資客大幅加倉
股票上杠桿什么意思:股票推薦平臺(tái)排名-8月29日漲停復(fù)盤:76只股漲停 天普股份6連板
看股票用什么手機(jī)軟件:黑馬股票推薦排名-退休的券商分公司老總被罰 代客交易虧近300萬 還有兩券商違規(guī)攬客
股票配資官網(wǎng)怎么看:買股票平臺(tái)推薦-美媒:特朗普支持率跌至新低
配資網(wǎng)站炒股:如何選擇合適的股票配資平臺(tái)-7月4日晚間滬深上市公司重大事項(xiàng)公告最新快遞
配查信-配查信平臺(tái)-十大配資公司平臺(tái)_杠桿配資平臺(tái)提示:文章來自網(wǎng)絡(luò),不代表本站觀點(diǎn)。
【導(dǎo)讀】貝泰妮打造初普運(yùn)營團(tuán)隊(duì),入局高端美容儀市場 沉寂多日的家用高端射頻美容儀Tripollar初普,最近被“藥...
???????2025年4月9日,恒生科技ETF基金(159741.SZ)收漲1.96%,發(fā)生1筆溢價(jià)大宗交易,成交價(jià)為...
中華人民共和國和西班牙王國關(guān)于加強(qiáng)全面戰(zhàn)略伙伴關(guān)系的行動(dòng)計(jì)劃(2025-2028年)應(yīng)中華人民共和國國務(wù)院總理李...
界面新聞?dòng)浾遼龍力隨著上市公司年報(bào)的披露,私募2024年第四季度的“新寵”也陸續(xù)浮出水面。Wind數(shù)...
藥企巨頭輝瑞的業(yè)績持續(xù)回升,新冠業(yè)務(wù)依然貢獻(xiàn)不小。 8月5日美股盤前,美國輝瑞公司(NYSE:PFE)發(fā)布202...
賽微微電4月9日晚間公告,2024年實(shí)現(xiàn)營業(yè)收入3.93億元,同比增長57.64%;歸屬于上市公司股東的凈利潤7883....
日前,國務(wù)院辦公廳印發(fā)《關(guān)于逐步推行免費(fèi)學(xué)前教育的意見》,推進(jìn)學(xué)前教育普及普惠安全優(yōu)質(zhì)發(fā)展。 意見明確,從2025...
記者王珍中國國際經(jīng)濟(jì)交流中心副理事長、國務(wù)院發(fā)展研究中心原副主任王一鳴周一在“中國發(fā)展高層論壇2025...
記者辛圓3月25日,博鰲亞洲論壇旗艦報(bào)告《亞洲經(jīng)濟(jì)前景及一體化進(jìn)程2025年度報(bào)告》(以下簡稱《報(bào)告》...
記者|趙陽戈年初,證監(jiān)會(huì)就修改《證券發(fā)行與承銷管理辦法》部分條款向社會(huì)公開征求意見,市場也將注意力投向了...
3月24日,易方達(dá)國證自由現(xiàn)金流ETF公開發(fā)售。該產(chǎn)品跟蹤國證自由現(xiàn)金流指數(shù),這個(gè)指數(shù)是什么?有哪些優(yōu)勢(shì)?投資價(jià)值如何?...
近日,開源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認(rèn)定相關(guān)業(yè)務(wù)六個(gè)月。該懲處力度在近年來券商分支機(jī)構(gòu)中并...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價(jià)拉漲,尾盤封漲停板...
3月24日,業(yè)內(nèi)權(quán)威專家表示,MLF(中期借貸便利)不再有統(tǒng)一的中標(biāo)利率,標(biāo)志著MLF利率的政策屬性完全退出。3月24日...