a级毛毛片_亚洲99_魔兽1~6集在线观看_黑白配在线观看_天天操日日操_四虎免费网站

首頁(yè) > 知識(shí)分享 > 知識(shí)分享 > LLM首次達(dá)到人類語(yǔ)言專家水平,OpenAI o1拿下拆解句法、識(shí)別歧義、推理音律

LLM首次達(dá)到人類語(yǔ)言專家水平,OpenAI o1拿下拆解句法、識(shí)別歧義、推理音律

發(fā)布時(shí)間:2025-11-08 18:08:45

LLM再下一城!伯克利研究證明:OpenAI的o1被證明也具有匹敵人類語(yǔ)言學(xué)家的元分析能力。

在人類諸多才能之中,哪些才是人類所獨(dú)有的?

自古希臘哲人亞里士多德以來(lái),語(yǔ)言便被視為最能彰顯人之本性的標(biāo)志。他曾言:人類乃「具有語(yǔ)言的動(dòng)物」。

即使當(dāng)今的大語(yǔ)言模型如ChatGPT已能在表層上模擬人類的日常言談,學(xué)者們依然追問(wèn):

在人類語(yǔ)言的深處,是否蘊(yùn)藏著某些獨(dú)特的結(jié)構(gòu)與特質(zhì),是任何其他生物的溝通方式,乃至AI的運(yùn)算體系,皆無(wú)法真正企及的?

加州大學(xué)伯克利分校語(yǔ)言學(xué)家、羅格斯大學(xué)的攜手,讓多個(gè)大語(yǔ)言模型經(jīng)受一系列語(yǔ)言學(xué)測(cè)試——其中包括要求模型歸納虛構(gòu)語(yǔ)言的規(guī)則。

雖然大多數(shù)大語(yǔ)言模型未能像人類那樣解析語(yǔ)言學(xué)規(guī)則,但有一個(gè)模型展現(xiàn)出遠(yuǎn)超預(yù)期的驚人能力。它能像語(yǔ)言學(xué)研究生那樣分析語(yǔ)言——劃分句子成分、解析多重歧義,并能運(yùn)用遞歸等復(fù)雜語(yǔ)言學(xué)特征。

研究者Gašper Beguš表示,這一發(fā)現(xiàn)「挑戰(zhàn)了我們對(duì)人工智能能力的認(rèn)知」。

AI會(huì)說(shuō)話不稀奇,會(huì)解釋才稀奇——

如果語(yǔ)言是讓我們成為人類的關(guān)鍵,那么如今大語(yǔ)言模型獲得了「元語(yǔ)言」能力,這又意味著什么呢?

LLM構(gòu)建無(wú)窮遞歸

想象一下:你在搭一座一層套一層、像俄羅斯套娃一樣的「句子塔」。

每套進(jìn)一層,理解難度就指數(shù)級(jí)上升。

這種結(jié)構(gòu),在語(yǔ)言學(xué)里叫「中心嵌入」(center embedding),曾被知名語(yǔ)言學(xué)家喬姆斯基稱為能定義人類語(yǔ)言與思維的決定性特征。

比如這句話:

The worldview that the prose Nietzsche wrote expressed was unprecedented.

(大意為:尼采所寫(xiě)的那篇散文所表達(dá)的世界觀是前所未有的。)

表面上看平平無(wú)奇,但如果你拆開(kāi)它的「語(yǔ)言洋蔥」:

最外層:The worldview [...] was unprecedented(這個(gè)「世界觀」前所未有);

套進(jìn)去一層:that the prose [...] expressed(是「那篇散文所表達(dá)的」);

再往里一層:Nietzsche wrote(而這篇散文是「尼采寫(xiě)的」)。

這就像在一個(gè)句子中間,又塞進(jìn)一個(gè)完整的句子,再在那個(gè)句子里塞進(jìn)另一個(gè)句子——三層套娃,層層遞歸。

人類能理解這樣的句子,但之前,人們認(rèn)為這樣的能力大模型不具備。

上述句子在真實(shí)對(duì)話中幾乎從未出現(xiàn)過(guò)——因?yàn)榇蠹視?huì)覺(jué)得它「太繞了!」

所以,任何語(yǔ)言模型如果只是靠「背書(shū)」,根本不可能見(jiàn)過(guò),自然也無(wú)法識(shí)別出這種例子。

語(yǔ)言學(xué)家們認(rèn)為,人類語(yǔ)言從有限詞匯和有限規(guī)則中生成無(wú)限可能句子,這種能力歸因于無(wú)限遞歸。

迄今為止,還沒(méi)有令人信服的證據(jù)表明其他動(dòng)物能夠以復(fù)雜的方式使用遞歸。

圖1:不同大模型識(shí)別多重遞歸,繪制正確語(yǔ)法樹(shù)的比例

圖1:不同大模型識(shí)別多重遞歸,繪制正確語(yǔ)法樹(shù)的比例

然而,該研究指出在眾多大模型中,唯有OpenAI o1模型不僅看懂包含多重遞歸的句子(圖1)。

o1不僅能如同語(yǔ)言學(xué)家那樣,以接近100%的正確率畫(huà)出正確的樹(shù)狀結(jié)構(gòu),還能將本就復(fù)雜的句子變得更多一層。

圖2:該句子對(duì)應(yīng)的正確語(yǔ)法樹(shù)

圖2:該句子對(duì)應(yīng)的正確語(yǔ)法樹(shù)

當(dāng)它被問(wèn):「能不能再加一層遞歸?」o1回復(fù):

The worldview that the prose that the philosopher Nietzsche admired wrote expressed was unprecedented.

「那位尼采所敬仰的哲學(xué)家所撰寫(xiě)的散文所表達(dá)的世界觀是前所未有的。」

這說(shuō)明o1不僅能夠使用語(yǔ)言,還能夠思考語(yǔ)言,具備元語(yǔ)言能力(metalinguistic capacity )。

由于語(yǔ)言模型只是在預(yù)測(cè)句子中的下一個(gè)單詞,人對(duì)語(yǔ)言的深層理解在質(zhì)上有所不同。因此,一些語(yǔ)言學(xué)家表示,大模型實(shí)際上并沒(méi)有在處理語(yǔ)言。

這項(xiàng)研究的結(jié)論看起來(lái)是對(duì)上述觀點(diǎn)的否定。

大模型能區(qū)分歧義

也能深入理解句子

想象一下,你聽(tīng)到下面的話:「Eliza wanted her cast out.」

乍一聽(tīng),好像就是「Eliza想把她的cast趕出去」?

但「cast」這個(gè)詞既可以是動(dòng)詞(「驅(qū)逐」),也可以是名詞(「石膏」)!

于是這句話就有兩種不同的含義,分別是

Eliza想要她的石膏被拿出去,

Eliza想把她趕出去。

這樣識(shí)別包含多義性句子的能力,之前同樣被認(rèn)為大模型不具備。

人類擁有很多常識(shí)知識(shí),使我們能夠排除歧義。但大模型很難具有這樣的常識(shí)知識(shí)水平。

然而該研究表明,o1可正確識(shí)別兩種結(jié)構(gòu),并為每種生成了符合語(yǔ)言學(xué)規(guī)劃的句法樹(shù)。其他模型(如 GPT-4、Llama 3.1)只會(huì)生成不合語(yǔ)法的結(jié)構(gòu),還會(huì)對(duì)語(yǔ)義產(chǎn)生誤解。

該研究還考察了大模型在音韻學(xué)相關(guān)任務(wù)上的表現(xiàn)——

音韻學(xué)是研究聲音模式以及最小的聲音單位,即音素的組織方式。

例如,在英語(yǔ)中,給以「g」結(jié)尾的詞加上「s」會(huì)發(fā)出「z」的音,就像「dogs」一樣。但給以「t」結(jié)尾的詞加上「s」聽(tīng)起來(lái)更像標(biāo)準(zhǔn)的「s」音,就像「cats」一樣。

該研究一口氣創(chuàng)建了30種新的迷你語(yǔ)言,以了解大模型是否能夠在面對(duì)新生成的虛擬語(yǔ)言時(shí),在沒(méi)有任何先驗(yàn)知識(shí)的情況下能不能正確推斷語(yǔ)音規(guī)則。

結(jié)果出人意料,即使是在這些虛構(gòu)的語(yǔ)言上,o1在音韻相關(guān)的任務(wù)上表現(xiàn)依舊出色。

大模型比人類更好地理解語(yǔ)言嗎?

從上述三個(gè)例子可以看出,曾經(jīng)那些被認(rèn)為僅僅人類能夠擁有的語(yǔ)言理解能力,大模型如今也具備了。

2023 年著名語(yǔ)言學(xué)家喬姆斯基在《紐約時(shí)報(bào)》上寫(xiě)道:「語(yǔ)言的正確解釋很復(fù)雜,不能僅僅通過(guò)浸泡在大數(shù)據(jù)中就能學(xué)會(huì)。」

該文認(rèn)為盡管 AI 模型在運(yùn)用語(yǔ)言方面可能很擅長(zhǎng),但它們并不具備以復(fù)雜方式分析語(yǔ)言的能力。

在此思潮影響下,即使ChatGPT在各方面上復(fù)制了自然語(yǔ)言,公眾仍想知道大模型是否有人類語(yǔ)言的特定特征能不能由大模型復(fù)現(xiàn)。

這當(dāng)然很有必要,隨著社會(huì)越來(lái)越依賴大模型,了解它在哪些方面能成功以及哪些方面會(huì)失敗變得越來(lái)越重要。

語(yǔ)言分析是評(píng)估語(yǔ)言模型推理能力與人類相似程度的理想測(cè)試平臺(tái)。

而o1能夠以與語(yǔ)言學(xué)家相似的方式分析語(yǔ)言,例如繪制句子圖、解決多個(gè)歧義含義,并利用遞歸等復(fù)雜的語(yǔ)言特征

但我們發(fā)現(xiàn)這一現(xiàn)象后,人們不禁會(huì)問(wèn)下面兩個(gè)問(wèn)題:

第一個(gè)問(wèn)題是為何只有o1可行,其它大模型表現(xiàn)都差一大截。

回答是相比其它模型,o1 的優(yōu)勢(shì)很可能源于思維鏈(類似Deepseek的深度思考),使其能像人類語(yǔ)言學(xué)家一樣逐步推理、驗(yàn)證假設(shè)、構(gòu)建抽象規(guī)則。

第二個(gè)問(wèn)題是當(dāng)模型的性能隨著規(guī)模變大而變大時(shí),大模型是否有一天會(huì)比我們更能準(zhǔn)確的理解語(yǔ)言嗎?

對(duì)于這個(gè)問(wèn)題的回答,目前還沒(méi)有定論。

一方面,任何的大模型在語(yǔ)言學(xué)上還沒(méi)有提出過(guò)原創(chuàng)性的觀點(diǎn),也沒(méi)有教給我們關(guān)于語(yǔ)言的新知識(shí)。

另一方面,增加計(jì)算能力和訓(xùn)練數(shù)據(jù),語(yǔ)言模型最終會(huì)在語(yǔ)言技能上超越我們,   看不出有什么理由阻止語(yǔ)言模型展現(xiàn)出比我們更好的語(yǔ)言理解能力。

研究尚不足以宣稱「機(jī)器理解語(yǔ)言勝于人類」,但足以改變?cè)u(píng)價(jià)口徑:對(duì)模型的考察,應(yīng)從「任務(wù)產(chǎn)出」轉(zhuǎn)向「結(jié)構(gòu)解釋」。

當(dāng)可解釋性成為首要指標(biāo),AI研究、教育與應(yīng)用治理將迎來(lái)同一套標(biāo)準(zhǔn)——把「為什么對(duì)」放在「對(duì)不對(duì)」之前。

知識(shí)分享更多>>

全新Q5L上市、全新A6L首秀!越過(guò)千萬(wàn)輛之巔的奧迪,再度啟航 現(xiàn)代帕里斯帝獲得北美年度汽車(chē)! 一份年度成績(jī)單,再證CR-V“全維度”哲學(xué) 上汽大眾首款9系旗艦ID. ERA 9X亮相:一款車(chē),一場(chǎng)轉(zhuǎn)型的宣言 極狐喬心昱:北汽新能源自動(dòng)駕駛技術(shù)全覆蓋 L3級(jí)至L4級(jí)全貫通 50萬(wàn)內(nèi)實(shí)用標(biāo)桿?廣汽本田新款飛度正式上市 煥新價(jià)6.68萬(wàn)元 央視鏡頭直擊-21℃極寒戰(zhàn)場(chǎng)!東風(fēng)睿立達(dá)完成中汽冬測(cè),破解物流凍阻難題 本田汽車(chē)近日官宣品牌標(biāo)識(shí)煥新計(jì)劃,沿用多年的經(jīng)典\"H\"標(biāo)將升級(jí)為全新設(shè)計(jì)版本,新標(biāo)識(shí)定于2027年正式啟用 星動(dòng)紀(jì)元與順豐科技簽約,推動(dòng)具身智能機(jī)器人在供應(yīng)鏈落地 德系豪華三強(qiáng),連續(xù)兩年失守中國(guó)市場(chǎng) 萬(wàn)能的《甄嬛傳》,在迅雷反腐這兒就失靈了? 沃爾沃EX60純電SUV將搭載谷歌Gemini AI,配大尺寸豎屏 聯(lián)發(fā)科發(fā)布天璣9500s:3nm工藝,支持硬件級(jí)光線追蹤技術(shù) 消息稱鴻蒙智行1月20日前后分批推送華為乾崑智駕ADS 4.1 美運(yùn)營(yíng)商Verizon服務(wù)中斷十小時(shí):波及數(shù)十萬(wàn)人,官方承諾補(bǔ)償 金融時(shí)報(bào):蘋(píng)果避開(kāi)AI燒錢(qián)大戰(zhàn),卻成為谷歌與OpenAI的“造王者” 李小龍透露華為手表市場(chǎng)份額超手機(jī),國(guó)內(nèi)超30%使用非華為手機(jī) 賈國(guó)龍確認(rèn):西貝將關(guān)閉102家門(mén)店 “酸菜魚(yú)之王”賣(mài)不動(dòng)了? 太二親手拆招牌,轉(zhuǎn)戰(zhàn)川菜賽道 日本霸占20年的汽車(chē)銷(xiāo)量第一寶座,2026年被中國(guó)掀翻了? 為何中國(guó)茶業(yè)跑不出一個(gè)「茅臺(tái)」? 房企聚焦核心城市“掐尖”,北上杭三城2025年土地出讓收入均超千億元 順豐同城元旦同城配送單量同比增55%,攜手敦煌美術(shù)研究所神馬IP共啟新年 AMD預(yù)告MI500處理器,性能提升千倍!還首秀了商用人形機(jī)器人 京東數(shù)字人上線“直播間復(fù)刻”功能 阿里Qoder升級(jí)補(bǔ)全功能,AI代碼采納率提升65% 3.2億元新訂單!佑駕創(chuàng)新智能座艙方案獲全球知名車(chē)企定點(diǎn) FF任命企業(yè)家及私募股權(quán)投資人Shahryar Oveissi擔(dān)任戰(zhàn)略顧問(wèn) 特斯拉將考慮自建芯片工廠;馬斯克萬(wàn)億美元薪酬方案獲批;日產(chǎn)汽車(chē)上季度營(yíng)業(yè)利潤(rùn)轉(zhuǎn)正 馬斯克:特斯拉擬自建芯片工廠,并考慮與英特爾合作
主站蜘蛛池模板: 一区二区三区黄 | 国产激情视频一区 | 91大神在线免费观看 | 人人看人人草 | 国产一区 | 日本免费精品 | 成人午夜视频网站 | 日韩av在线网 | 欧美日韩中文字幕在线 | 麻豆一二三区 | 一级黄色在线 | 精品久久视频 | 在线观看你懂的视频 | 一区二区三区免费在线 | 男人的天堂a在线 | 91看看 | 在线免费黄| 夜夜艹| 中文字幕成人在线 | 国产精品一二三 | 好男人www社区在线视频夜恋 | 欧美日本在线观看 | 特黄视频在线观看 | 色女人av| 91麻豆成人精品国产 | 午夜影院黄色片 | 女同性αv亚洲女同志 | 中文无码日韩欧 | 看毛片的网址 | 日韩在线观看一区二区三区 | 久久久久少妇 | 亚洲黄视频 | 69精品人人 | 黄色片毛片 | 亚洲免费影院 | 亚洲伦理中文字幕 | 免费黄色在线视频 | 天天操天天干天天干 | 秋霞影院午夜伦 | 青青草97国产精品免费观看 | 色综合天天综合网天天狠天天 |