日韩欧美看片,日韩欧美一区二区在线,高清乱码一区二区三区

六道題每題可得7分，總分最高42分。谷歌DeepMind的人工智能系統(tǒng)在今年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中最終得分28分。今年金牌的門檻是29分，在正式比賽的609名選手中，58名達(dá)到了這一門檻。

谷歌推出兩大數(shù)學(xué)模型，19秒解開IMO2024幾何問(wèn)題

DeepMind人工智能系統(tǒng)在IMO 2024上相對(duì)于人類競(jìng)爭(zhēng)者的表現(xiàn)。在42分的總分中，人工智能系統(tǒng)獲得了28分。

谷歌DeepMind的AI模型解決了今年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽（IMO）六個(gè)問(wèn)題中的四個(gè)問(wèn)題，人工智能首次達(dá)到了銀牌標(biāo)準(zhǔn)。

當(dāng)?shù)貢r(shí)間7月25日，谷歌DeepMind公布專用于數(shù)學(xué)推理的模型AlphaProof，以及專注于幾何的模型更新版本AlphaGeometry 2。DeepMind表示，AlphaProof和AlphaGeometry 2解決了數(shù)學(xué)中的高級(jí)推理問(wèn)題，具有先進(jìn)數(shù)學(xué)推理能力的通用人工智能或開啟科學(xué)和技術(shù)的新領(lǐng)域。

IMO是歷史最悠久、規(guī)模最大、最負(fù)盛名的青年數(shù)學(xué)家競(jìng)賽，自1959年以來(lái)每年舉辦一次。選手要解決代數(shù)、組合學(xué)、幾何和數(shù)論方面六個(gè)異常困難的問(wèn)題。菲爾茲獎(jiǎng)是數(shù)學(xué)家的最高榮譽(yù)之一，菲爾茲獎(jiǎng)獲得者也會(huì)代表他們的國(guó)家參加IMO。

近年來(lái)，IMO競(jìng)賽被認(rèn)為是機(jī)器學(xué)習(xí)領(lǐng)域的重大挑戰(zhàn)，也是衡量人工智能系統(tǒng)高級(jí)數(shù)學(xué)推理能力的理想基準(zhǔn)。

谷歌DeepMind表示，IMO的數(shù)學(xué)問(wèn)題被人工翻譯成數(shù)學(xué)語(yǔ)言，供系統(tǒng)理解。在正式比賽中，學(xué)生們分兩次提交答案，每次4.5小時(shí)。而人工智能系統(tǒng)在幾分鐘內(nèi)解決了一個(gè)問(wèn)題，花了三天時(shí)間來(lái)解決其他問(wèn)題。基于強(qiáng)化學(xué)習(xí)的推理系統(tǒng)AlphaProof解決了兩個(gè)代數(shù)問(wèn)題和一個(gè)數(shù)論問(wèn)題并被證明答案正確，這些問(wèn)題包括今年IMO比賽中只有5名選手解決的最難的問(wèn)題。AlphaGeometry 2證明了幾何問(wèn)題，但兩個(gè)組合問(wèn)題仍未解決。

六道題每題可得7分，總分最高可達(dá)42分。DeepMind的人工智能系統(tǒng)最終得分28分。DeepMind表示，今年金牌的門檻從29分開始，在正式比賽的609名選手中，有58名達(dá)到了這個(gè)門檻。

“事實(shí)上，這個(gè)程序能想出這樣一個(gè)不明顯的結(jié)構(gòu)是非常令人印象深刻的，遠(yuǎn)遠(yuǎn)超出了我認(rèn)為的最先進(jìn)的水平。”IMO金牌得主和菲爾茲獎(jiǎng)牌得主蒂莫西·高爾斯（Timothy Gowers）表示。

在大量書面文本上訓(xùn)練的人工智能模型歷來(lái)在數(shù)學(xué)推理方面很困難，往往傾向于語(yǔ)言智能而非數(shù)學(xué)智能，解決數(shù)學(xué)問(wèn)題需要更復(fù)雜的推理技能。AlphaProof將預(yù)先訓(xùn)練好的語(yǔ)言模型與AlphaZero強(qiáng)化學(xué)習(xí)算法結(jié)合在一起，AlphaZero此前自學(xué)了如何掌握國(guó)際象棋、將棋和圍棋。

大語(yǔ)言模型容易產(chǎn)生幻覺(jué)，或以令人信服的方式傳遞錯(cuò)誤信息。DeepMind表示，盡管基于自然語(yǔ)言的方法可以訪問(wèn)更多數(shù)據(jù)，但會(huì)產(chǎn)生看似合理但不正確的中間推理步驟和解決方案。而形式語(yǔ)言提供了一個(gè)重要優(yōu)勢(shì)，即涉及數(shù)學(xué)推理的證明可以被形式化地驗(yàn)證其正確性。“我們通過(guò)微調(diào)Gemini模型，在這兩個(gè)互補(bǔ)的領(lǐng)域之間建立了一座橋梁，自動(dòng)將自然語(yǔ)言問(wèn)題語(yǔ)句轉(zhuǎn)換為形式語(yǔ)句，創(chuàng)建了一個(gè)不同難度的龐大形式問(wèn)題庫(kù)。”

當(dāng)遇到一個(gè)數(shù)學(xué)問(wèn)題時(shí)，AlphaProof會(huì)生成候選解決方案，然后搜索可能的證明步驟來(lái)證明或反駁它們。每一個(gè)被發(fā)現(xiàn)和驗(yàn)證的證明都被用來(lái)強(qiáng)化AlphaProof的語(yǔ)言模型，增強(qiáng)其解決后續(xù)更具挑戰(zhàn)性問(wèn)題的能力。

谷歌推出兩大數(shù)學(xué)模型，19秒解開IMO2024幾何問(wèn)題

a级毛毛片_亚洲99_魔兽1～6集在线观看_黑白配在线观看_天天操日日操_四虎免费网站

谷歌推出兩大數(shù)學(xué)模型，19秒解開IMO2024幾何問(wèn)題

創(chuàng)作內(nèi)容更多>>